Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Адская молотилка». Десять выстрелов в минуту в одну точку «Адская молотилка». Десять выстрелов в минуту в одну точку

Российская армия приняла на вооружение артиллерийского монстра

Популярная механика
Почему машина заводится и глохнет и что с этим делать Почему машина заводится и глохнет и что с этим делать

Что делать, если машина глохнет: причины, диагностика, куда смотреть

РБК
Долгая счастливая жизнь Долгая счастливая жизнь

Старение – это естественно, но не нормально

Популярная механика
Финкульт-привет Финкульт-привет

Низкая финграмотность — вызов не только для клиентов, но и для банков

Ведомости
Мы из будущего Мы из будущего

«Белая Вежа» — один из самых интересных научных центров

ТехИнсайдер
Переходим на летнее время Переходим на летнее время

7 актуальных задач, которые легче решить под ярким солнцем

Лиза
Выживут только инфорги Выживут только инфорги

«Инфорги» — люди, которые придут на смену Homo Sapiens

Популярная механика
«Нет удержу!» Чем улыбнул первый тест-драйв «ушастого Запорожца», проведенный советским журналистом «Нет удержу!» Чем улыбнул первый тест-драйв «ушастого Запорожца», проведенный советским журналистом

«Ушастый Запорожец» — тесный, шумный, тихоходный или совсем иной?

ТехИнсайдер
Этого не может быть Этого не может быть

Самые удивительные гипотезы в биологии

ТехИнсайдер
Самоубийство семьи бургомистра Самоубийство семьи бургомистра

«Кризис закончен. Орудия затихли. Кто знал, как нам стоит поступить?»

Дилетант
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
JALAGONIA: «Мой первый альбом написан от души, вы это почувствуете» JALAGONIA: «Мой первый альбом написан от души, вы это почувствуете»

JALAGONIA за 21 год уже прошла большой творческий путь

ЖАРА Magazine
Шоу должно продолжаться Шоу должно продолжаться

Самые интересные премьеры Женевского автосалона

Популярная механика
Любовь к животным и санкции Любовь к животным и санкции

Почему рынок кормов — перспективное направление для инвестиций

Агроинвестор
Восхождение дракона Восхождение дракона

Как Поднебесной удалось стать центром мирового автопрома?

Robb Report
Компьютерное зрение: когда роботы перестали тыкать пальцем в небо? Компьютерное зрение: когда роботы перестали тыкать пальцем в небо?

Зачем нужно компьютерное зрение и какие задачи оно решает в разных сферах

Наука и техника
Противолодочная война Противолодочная война

Подводная охота вернулась

Популярная механика
Группы, в которых не менялся состав. Никогда Группы, в которых не менялся состав. Никогда

Группы, в которых состав отличается своей стабильностью

Maxim
Солнечные гибриды Солнечные гибриды

Как прокладывается путь к созданию серийных солнцемобилей

ТехИнсайдер
Самый секретный агент Самый секретный агент

Из чего сделан мир Джеймса Бонда Яна Флеминга

Weekend
Советский Дэн Сяопин? Советский Дэн Сяопин?

Именно Андропов смог нарисовать траекторию экономических реформ. Так ли это?

Дилетант
Правило рецидивиста Правило рецидивиста

Норма, именуемая сегодня «Правилом Миранды», существовала далеко не всегда

Дилетант
Филипп Киркоров: «Публика принимает меня любым, но далеко не всё прощает» Филипп Киркоров: «Публика принимает меня любым, но далеко не всё прощает»

Какой путь прошел Филипп Киркоров и сколько еще впереди

ЖАРА Magazine
6 бытовых привычек, из-за которых в доме плохо пахнет 6 бытовых привычек, из-за которых в доме плохо пахнет

Некоторые из этих вещей вы совершаете ежедневно, а они влияют на запах в доме

ТехИнсайдер
Динозавры за Полярным кругом Динозавры за Полярным кругом

Как жили динозавры и их соседи в условиях крайнего Севера или Юга

Наука и техника
Жизнь Васи Ложкина Жизнь Васи Ложкина

Художник Вася Ложкин: котики, музыка, театральная сцена

Отдых в России
Объединяя народы Объединяя народы

Летний уикенд в Казани — что посмотреть в столице Татарстана?

Отдых в России
Ну и дела… Ну и дела…

Считается, что нашумевшее в свое время «рыбное дело» началось с казуса...

Дилетант
Не женское дело? Не женское дело?

Еще 20–30 лет назад женщина-режиссёр воспринималась как нечто исключительное

Дилетант
Токари без кодеров Токари без кодеров

Каких айтишников не хватает промышленности России?

Ведомости
Открыть в приложении