Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Эмоциональный интеллект для менеджеров проектов Эмоциональный интеллект для менеджеров проектов

Навыки работы с людьми, необходимые для достижения лучших результатов

kiozk originals
Руки помогли в семантической обработке слов Руки помогли в семантической обработке слов

Ограничение свободы рук влияет на семантическую обработку слов

N+1
Голубой вагон, голубой щенок, голубая чашка: откуда в СССР была такая любовь к голубому цвету? Голубой вагон, голубой щенок, голубая чашка: откуда в СССР была такая любовь к голубому цвету?

В советской культуре был явный перебор с голубым цветом

ТехИнсайдер
Синдром Плюшкина. Как справиться с патологическим накопительством Синдром Плюшкина. Как справиться с патологическим накопительством

Хординг, который неофициально называют синдромом Плюшкина, – это расстройство

Лиза
Жадность и отвага Жадность и отвага

Отечественные трейдеры продолжают покупать иностранные акции

Эксперт
«Приходится доказывать, что мы не слабее и не хуже»: истории женщин-хирургов «Приходится доказывать, что мы не слабее и не хуже»: истории женщин-хирургов

Женщины, которые выбрали хирургию вопреки гендерным стереотипам

Forbes
Хардкор, еще хардкор Хардкор, еще хардкор

12 случаев из сексуальной жизни отечественного экрана в 2010‑х

Weekend
Рубин Черного Принца: проклятый камень британской короны, который достанется Карлу III Рубин Черного Принца: проклятый камень британской короны, который достанется Карлу III

Один из старейших камней, украшающий корону, по слухам — проклят

VOICE
Миллион нереализованных идей: как дать новую жизнь «похороненным» мечтам Миллион нереализованных идей: как дать новую жизнь «похороненным» мечтам

Мечта приходит, чтобы показать, чего мы хотим на самом деле

Psychologies
Панки, шпионы и Уорхол: кто сделал Елизавету II поп-иконой Панки, шпионы и Уорхол: кто сделал Елизавету II поп-иконой

Кто сопровождал Елизавету II на пути к статусу поп-культурной иконы

Правила жизни
Присвоение истории Присвоение истории

«Три тысячи лет желаний»: Джордж Миллер экранизирует Антонию Байетт

Weekend
10 культовых вещей из кино. Часть вторая, женская 10 культовых вещей из кино. Часть вторая, женская

Вспоминаем самые известные предметы одежды из истории мирового кинематографа

Правила жизни
Не только жара. 13 причин, из-за которых ты часто потеешь во сне Не только жара. 13 причин, из-за которых ты часто потеешь во сне

Потеешь во сне? Мы объясним, как отличить норму от возможных нарушений

Лиза
Главные писатели-эмигранты из России. Узнаете ли вы всех? Главные писатели-эмигранты из России. Узнаете ли вы всех?

Самые знаменитые "культурные" эмигранты

ТехИнсайдер
«Тяжелые времена для обувного бизнеса»: почему закрылся бренд, который обувал Урганта «Тяжелые времена для обувного бизнеса»: почему закрылся бренд, который обувал Урганта

История российского обувного бренда Gottlieb Schwarz

Forbes
Как слышится, так и пишется Как слышится, так и пишется

Пять художников и иллюстраторов изобразили, как представляют себе музыку

Правила жизни
Как просить прощения, чтобы тебя действительно простили Как просить прощения, чтобы тебя действительно простили

Как правильно просить прощения

VOICE
Архитектор Александр Козлов — об облике Москвы, модном и вечном интерьере Архитектор Александр Козлов — об облике Москвы, модном и вечном интерьере

Интервью с Александром Козловом, представителем интерьерной архитектуры

РБК
Найден способ охладить полюса Земли на 2°C «очень дешево» Найден способ охладить полюса Земли на 2°C «очень дешево»

Можно ли снизить температуру на Земле?

ТехИнсайдер
5 нездоровых шаблонов мышления и чем их заменить 5 нездоровых шаблонов мышления и чем их заменить

Зачастую причина эмоциональной нестабильности в нездоровых шаблонах мышления

Psychologies
Пассивная система охлаждения в ноутбуках: это хорошо или плохо? Пассивная система охлаждения в ноутбуках: это хорошо или плохо?

Ноутбуки с пассивной системой охлаждения — что это за «зверь»?

CHIP
Секс после развода. 10 советов, чтобы ничего не испортить Секс после развода. 10 советов, чтобы ничего не испортить

Что сделать, чтобы секс с новым поклонником или бывшим мужем был приятным?

Лиза
Сам себе коуч Сам себе коуч

Такой вы актрису Глафиру Тарханову еще не видели

OK!
Как были устроены сервисы доставки в царской России, рассказывает автор подкаста «Закат Империи» Андрей Аксенов Как были устроены сервисы доставки в царской России, рассказывает автор подкаста «Закат Империи» Андрей Аксенов

Как жители Российской империи заказывали доставку без интернета и смартфонов?

СНОБ
У человека нет никакого У человека нет никакого

Концепция «мозга ящерицы» у млекопитающих может быть одним огромным заблуждением

ТехИнсайдер
Как правильно бегать под дождем Как правильно бегать под дождем

9 правил, которые максимально обезопасят тебя для тренировок в непогоду

Maxim
Разговаривает с деревьями и возит за собой спальню: самые странные причуды нового короля Англии Карла III Разговаривает с деревьями и возит за собой спальню: самые странные причуды нового короля Англии Карла III

После этого любые твои закидоны покажутся заурядным хобби

Maxim
Старый Голливуд Старый Голливуд

Американская классика в стилистике Ralph Lauren

SALON-Interior
Литература или физика? Какой ты школьный предмет по знаку зодиака Литература или физика? Какой ты школьный предмет по знаку зодиака

Сейчас мы тебе расскажем, какой ты предмет по знаку зодиака!

VOICE
Как фильмы «Брат» и «Брат 2» запустили новые тренды и что они изменили в нашей жизни Как фильмы «Брат» и «Брат 2» запустили новые тренды и что они изменили в нашей жизни

«Брат» и «Брат 2»: как незаметно вершатся революционные вещи

Maxim
Открыть в приложении