Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Слайд-шоу Слайд-шоу

Авиадвигатель UltraFan, голова морских звезд и туристический хаб Epicon

ТехИнсайдер
Первый обзор нового Hyundai Santa Fe в России. Особенности, опции и цены Первый обзор нового Hyundai Santa Fe в России. Особенности, опции и цены

Autonews познакомился с новым Hyundai Santa Fe в России. Названы плюсы и минусы

РБК
Откуда что пошло на флоте. Навигационные огни Откуда что пошло на флоте. Навигационные огни

Как на свет появились навигационные огни для опознания судов?

Наука и техника
Валерий Фокин: Театр вписан в контекст времени Валерий Фокин: Театр вписан в контекст времени

Режиссер Валерий Фокин — о библейских текстах и вкусах современного зрителя

Ведомости
Де Голль — ставка на «зеро» Де Голль — ставка на «зеро»

Шарль де Голль: пятая республика, сильная власть, отставка правительства

Дилетант
Самый мощный Jeep 2025 года Самый мощный Jeep 2025 года

В линейке внедорожников от Jeep появились настоящие монстры

4x4 Club
Турецкие сериалы, экстрасенсы и астрология: эксперты назвали самые популярные «постыдные удовольствия» россиянок Турецкие сериалы, экстрасенсы и астрология: эксперты назвали самые популярные «постыдные удовольствия» россиянок

Топ удовольствий, о которых стыдно говорить

Psychologies
Национальный домен: какие приемы мировой практики в сети может применять российский бизнес Национальный домен: какие приемы мировой практики в сети может применять российский бизнес

Почему бизнес в России еще только в начале своего пути в онлайне

Inc.
Не дай себе замерзнуть! Не дай себе замерзнуть!

7 рабочих лайфхаков, которые помогут согреться в холода

Лиза
Кубиты любят тишину Кубиты любят тишину

Чем квантовый компьютер лучше классического?

Наука и жизнь
«85% кандидатов отказываются»: эффективна ли практика one-day offer «85% кандидатов отказываются»: эффективна ли практика one-day offer

Рекрутеры и HR-специалисты — о приёме на работу за один день

VC.RU
Почему витамины обозначаются буквами, а группа В еще и цифрами? Почему витамины обозначаются буквами, а группа В еще и цифрами?

Когда и как были открыты витамины и почему получили именно такие названия?

ТехИнсайдер
Страна пяти сфер Страна пяти сфер

В Индии пять чувств используются не только по назначению, но и по максимуму

Вокруг света
Все фильмы Дэвида Линча по порядку от хорошего к лучшему Все фильмы Дэвида Линча по порядку от хорошего к лучшему

Напоминаем кинофильмы Дэвида Линча, а еще то, что их нельзя смотреть по ТВ

Maxim
Незамеченная революция новатора-мученика: что нужно знать про Варлама Шаламова Незамеченная революция новатора-мученика: что нужно знать про Варлама Шаламова

Какую революцию Шаламов совершил в литературе и чем он отличается от Фуко

СНОБ
Карельские медведи оказались самыми подвижными среди европейских Карельские медведи оказались самыми подвижными среди европейских

Свободнее всего в Европе пространство осваивают карельские медведи

N+1
Как обработать фото, будто вы сделали его на пленку? Сохраните этот простой метод! Как обработать фото, будто вы сделали его на пленку? Сохраните этот простой метод!

Как сделать цифровые снимки похожими на пленку: инструкция

ТехИнсайдер
Почему уличные фонари в основном излучают желтый и оранжевый свет? Почему уличные фонари в основном излучают желтый и оранжевый свет?

Почему цвет фонарей на улицах не меняют уже столько лет?

ТехИнсайдер
«Я все для него делаю, а он!»: 10 способов самообороны от манипуляций «Я все для него делаю, а он!»: 10 способов самообороны от манипуляций

Хотите инструкцию, какие принять меры против манипуляций?

Psychologies
Что делать, если мужчина не держит слово в отношениях Что делать, если мужчина не держит слово в отношениях

Он обещал встретиться в выходные и «слился», сославшись на форс-мажор?

VOICE
Что будет с журналистикой в эпоху искусственного интеллекта? Узнайте мнение эксперта! Что будет с журналистикой в эпоху искусственного интеллекта? Узнайте мнение эксперта!

С какими рисками и возможностями столкнется журналистика с развитием ИИ?

ТехИнсайдер
Дмитрий Леонтьев: TANK 500 – 300 лошадей и странная реклама Дмитрий Леонтьев: TANK 500 – 300 лошадей и странная реклама

TANK 500: Бензиновый внедорожник, в котором, если порыться, можно найти гибрид

4x4 Club
Руфь Гринько «Комната утешения». Сказка как терапия Руфь Гринько «Комната утешения». Сказка как терапия

Отрывок из повести-сказки, которая поможет пережить страшные времена

СНОБ
«Выигрывают только выносливые»: как работает финансовая стратегия FIRE «Выигрывают только выносливые»: как работает финансовая стратегия FIRE

Реально ли стать «пенсионером», пока ты еще достаточно молод?

Forbes
Постельные сцены Постельные сцены

14 фактов о сне, которые сделают твои ночи комфортнее

Лиза
7 дорогих бьюти-процедур, которые однозначно стоят своих денег 7 дорогих бьюти-процедур, которые однозначно стоят своих денег

Что действительно нужно для получения результата и своевременного омоложения

VOICE
Больше никакого мутного налета и жира: как отмыть стеклянные крышки кастрюль и сковород Больше никакого мутного налета и жира: как отмыть стеклянные крышки кастрюль и сковород

Как вернуть былую чистоту и блеск стеклянным крышкам?

ТехИнсайдер
«Сигма-сигма бой»: о чем эта песня и почему она стала хитом во всем мире? «Сигма-сигма бой»: о чем эта песня и почему она стала хитом во всем мире?

«Сигма-сигма бой» стала хитом на мировых стримингах. В чем секрет успеха песни

Psychologies
Велосипеды, ткацкие станки и кофемолки: что выпускали известные автомобильные бренды до машин Велосипеды, ткацкие станки и кофемолки: что выпускали известные автомобильные бренды до машин

С каких товаров начинали свой путь автомобильные гиганты?

ТехИнсайдер
Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов

Насколько антиоксиданты безопасны и существует ли у них будущее?

Forbes
Открыть в приложении