Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Структура научных революций Структура научных революций

Новаторский анализ научного развития

kiozk originals
«Gaia»: новый взгляд на небо «Gaia»: новый взгляд на небо

Что телескоп «Gaia» позволил узнать о нашей Галактике?

Наука и жизнь
Как стиль воспитания влияет на будущую личную жизнь детей Как стиль воспитания влияет на будущую личную жизнь детей

Как уберечь детей от нездоровых отношений во взрослой жизни

Psychologies
Свайп среди чужих: как Tinder изменил нашу жизнь за 10 лет (и изменил ли) Свайп среди чужих: как Tinder изменил нашу жизнь за 10 лет (и изменил ли)

Tinder упростил нашу межличностную коммуникацию — или нет?

Правила жизни
7 способов решиться на перемены в жизни 7 способов решиться на перемены в жизни

Отказаться от старой привычки, начать новое дело — как на это решиться?

Psychologies
Их знают все: как сложилась жизнь легендарных советских телеведущих Их знают все: как сложилась жизнь легендарных советских телеведущих

Рассказываем о самых главных лицах голубых экранов СССР

VOICE
Кровавый навет: найденные в Англии останки принадлежат жертвам нориджской резни 1190 года Кровавый навет: найденные в Англии останки принадлежат жертвам нориджской резни 1190 года

Историки установили судьбу семнадцати людей, убитых более восьмисот лет назад

Вокруг света
Королева-отец: юнгианский психолог разбирает образ Елизаветы II Королева-отец: юнгианский психолог разбирает образ Елизаветы II

Елизавета II была отцовской фигурой — что это значит?

Psychologies
Ученые выяснили, как первой планирующей рептилии удавались фантастические прыжки, которым позавидуют даже акробаты Ученые выяснили, как первой планирующей рептилии удавались фантастические прыжки, которым позавидуют даже акробаты

Как крошечной рептилии удавалось так ловко планировать с дерева не дерево?

ТехИнсайдер
Елизавета II, автомеханик на престоле Елизавета II, автомеханик на престоле

Королеву Елизавету вспоминает бывший посол РФ в Великобритании

Дилетант

В есенинскую ловушку попал ни один десяток одиноких и замужних девушек

ТехИнсайдер
Демоны тревожной суеты и уныния: какие внутренние установки приводят нас к кризису Демоны тревожной суеты и уныния: какие внутренние установки приводят нас к кризису

Отрывок из книги «Сила кризиса» — о внутренних демонах, приводящих к кризису

Forbes
«Тяжелые времена для обувного бизнеса»: почему закрылся бренд, который обувал Урганта «Тяжелые времена для обувного бизнеса»: почему закрылся бренд, который обувал Урганта

История российского обувного бренда Gottlieb Schwarz

Forbes
Как быстро продать квартиру Как быстро продать квартиру

Что влияет на скорость продажи недвижимости?

СНОБ
Книги об искусственном интеллекте: что почитать о роботах, которым не чужды эмоции и чувства Книги об искусственном интеллекте: что почитать о роботах, которым не чужды эмоции и чувства

Книги, в центре сюжета которых роботы, испытывающие эмоции

ТехИнсайдер
Ученые раскрыли, что происходит с мозгом счастливых супругов Ученые раскрыли, что происходит с мозгом счастливых супругов

Синхронизация работы мозга является одним из важнейших условий успешного брака

Psychologies
«Наша стратегия — отличаться от конкурентов» «Наша стратегия — отличаться от конкурентов»

Управляющий холдинга рассказал, как компания планирует развивать бизнес

Агроинвестор
Правда ли, что бежавшие французы от голода ели своих сослуживцев? 5 удивительных фактов об Отечественной войне 1812 года Правда ли, что бежавшие французы от голода ели своих сослуживцев? 5 удивительных фактов об Отечественной войне 1812 года

Эти подробности Отечественной войны 1812 года удивят даже знатоков истории!

ТехИнсайдер
Крупнейшее восстание рабочих в США: вот какой была битва у горы Блэр Крупнейшее восстание рабочих в США: вот какой была битва у горы Блэр

Американские рабочие раньше устраивали целые сражения и где-то даже побеждали

ТехИнсайдер
Как устроен оргазм и в чем его истинное предназначение Как устроен оргазм и в чем его истинное предназначение

Почему во время оргазма подкашиваются ноги, что у него общего с чиханием?

ТехИнсайдер
Магические единороги и $900 за ничего: айтишники рассказали о своём опыте работы в «мутных» компаниях Магические единороги и $900 за ничего: айтишники рассказали о своём опыте работы в «мутных» компаниях

ИТ — это не всегда про непрерывное развитие, прозрачные процессы, командный дух

VC.RU
Будни блэкаута: можно ли выжить в городе без электричества? Будни блэкаута: можно ли выжить в городе без электричества?

Мы задумались: а что происходит с мегаполисом, лишенным электричества?

Maxim
Вскрытие показывает Вскрытие показывает

«Преступления будущего»: Дэвид Кроненберг возвращается к боди-хоррорам

Weekend
«Американская двухпартийность. От Джорджа Вашингтона до Джо Байдена». Как менялись партийные системы США «Американская двухпартийность. От Джорджа Вашингтона до Джо Байдена». Как менялись партийные системы США

Противостояние Демократической и Республиканской партий США

N+1
Тело случая Тело случая

Секс в позднесоветском кино

Weekend
10 лучших турецких сериалов о любви, от которых невозможно оторваться 10 лучших турецких сериалов о любви, от которых невозможно оторваться

Турецкие сериалы захватили мир

VOICE
10 неожиданных, но работающих способов согреться 10 неожиданных, но работающих способов согреться

На улице уже похолодало, а отопление еще не дали?

Maxim
Фото Лохнесского чудовища: новые подробности о том, что на самом деле запечатлели фотографы Фото Лохнесского чудовища: новые подробности о том, что на самом деле запечатлели фотографы

Существует ли Лохнесское чудовище и правдивы ли фото?

ТехИнсайдер
Образ жизни Образ жизни

Дизайнер Татьяна Парфенова показывает нам свой новый дом, лес и сад

Собака.ru
Сам себе исключение Сам себе исключение

Режиссер Вернер Херцог и его правила работы

Weekend
Открыть в приложении