Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пластичность мозга Пластичность мозга

Потрясающие факты о том, как мысли способны менять структуру и функции мозга

kiozk originals
Сонная прокрастинация: почему мы никак не идем спать? Сонная прокрастинация: почему мы никак не идем спать?

Почему время, отведенное на сон, мы тратим на листание ленты или сериалы?

Psychologies
Алгоритм определил уровень боли мыши по выражению морды Алгоритм определил уровень боли мыши по выражению морды

Алгоритм анализирует положение усов, ушей и зажмуривание глаз у мышей

N+1
Это уже другая история Это уже другая история

Я уехал в Москву в 2000-м. Через год появились «Звери»

Правила жизни
Мамаше невмоготу: отрывок из семейной саги о преодолении горя Мамаше невмоготу: отрывок из семейной саги о преодолении горя

Отрывок из романа Джойс Кэрол Оутс «Ночь, сон, смерть и звезды»

Forbes
Автор «Франкенштейна»: как Мэри Шелли пыталась найти свое место в литературе Автор «Франкенштейна»: как Мэри Шелли пыталась найти свое место в литературе

Как Мэри Шелли создала культового персонажа современной поп-культуры

Forbes
Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство

На примере пяти работ показываем, как Ман Рэй изменил фотографию и искусство

Правила жизни
Дизайн Дизайн

Дизайнеры вдохновляются Италией и идеей конструктора

Robb Report
Как спасти кожу от обезвоженности в отопительный сезон: гид по правильному уходу Как спасти кожу от обезвоженности в отопительный сезон: гид по правильному уходу

Как увлажнить кожу?

VOICE
Что говорит о тебе твоя лучшая подруга Что говорит о тебе твоя лучшая подруга

Кого и почему ты выбираешь в друзья?

VOICE
Титул Камиллы: как самая ненавидимая женщина Великобритании стала королевой-консортом Титул Камиллы: как самая ненавидимая женщина Великобритании стала королевой-консортом

Что для Камиллы Паркер-Боулз значит титул королевы-супруги?

Forbes
Киберпанк собачий! Тестируем робота-курьера о четырех ногах на улицах Москвы Киберпанк собачий! Тестируем робота-курьера о четырех ногах на улицах Москвы

Протестировали шагающего робота Alien Go и чуть не устроили ДТП!

ТехИнсайдер
Lina Lee Lina Lee

Lina Lee рассказала о пережитой депрессии и дебюте в кино

ЖАРА Magazine
Ученый-медиевист — о судьбе искусства в эпоху Web 3.0 и NFT Ученый-медиевист — о судьбе искусства в эпоху Web 3.0 и NFT

Почему цифровое искусство не столь уж далеко от средневекового

РБК
7 фраз, которые разрушают самооценку ребенка 7 фраз, которые разрушают самооценку ребенка

Предостерегаем вас от ядовитых замечаний, которые подрывают веру детей в себя

Psychologies
Дебош в похоронном бюро, столпотворение в Париже и прощание с Дианой: самые дорогие, масштабные и экстравагантные похороны за последние 150 лет Дебош в похоронном бюро, столпотворение в Париже и прощание с Дианой: самые дорогие, масштабные и экстравагантные похороны за последние 150 лет

Самые массовые и экстравагантные церемония прощания

Правила жизни
Шопинг против революции: как изобретатель универмага изменил мир Шопинг против революции: как изобретатель универмага изменил мир

Универсальные магазины были созданы, чтобы предотвратить восстания

Вокруг света
Как читать «Двенадцать» Блока Как читать «Двенадцать» Блока

Как Александр Блок относился к революции и в чем его упрекали современники

Культура.РФ
Манекен лося и запоры скорпионов: за что ученым раздали Шнобелевскую премию — 2022 Манекен лося и запоры скорпионов: за что ученым раздали Шнобелевскую премию — 2022

Эти открытия только с одной стороны их открытия выглядят смешными

Maxim
Среди предков современных жителей Памира нашли древних таримцев Среди предков современных жителей Памира нашли древних таримцев

Генетики исследовали происхождение популяций Центральной Азии

N+1
Демоны тревожной суеты и уныния: какие внутренние установки приводят нас к кризису Демоны тревожной суеты и уныния: какие внутренние установки приводят нас к кризису

Отрывок из книги «Сила кризиса» — о внутренних демонах, приводящих к кризису

Forbes
Убийственная сила сестринства: как женщины объединяются, чтобы избавиться от абьюзера Убийственная сила сестринства: как женщины объединяются, чтобы избавиться от абьюзера

Черная комедия о семье сильных женщин, в которую крайне неудачно попал абьюзер

Forbes
Подвижное в подвижном Подвижное в подвижном

Григорий Ревзин о Сирано де Бержераке и о том, как Вселенной достичь гармонии

Weekend
Боли, выделения, кровь: как стрессовые ситуации влияют на женское здоровье и что с этим делать Боли, выделения, кровь: как стрессовые ситуации влияют на женское здоровье и что с этим делать

Что делать, если из-за нервов у тебя возникли проблемы ниже пояса

VOICE
Бекон горя: как перестать заедать стресс Бекон горя: как перестать заедать стресс

Рассказываем, как избежать заедания эмоций

Правила жизни
Новые древние: бронированный малютка, родичи диплодока и огромный морской ящер Новые древние: бронированный малютка, родичи диплодока и огромный морской ящер

Древние ящеры: необычный щитоносец, рогач с Дикого запада и морские гиганты

N+1
В начале 20 века водители давили на газ, чтобы… остановиться В начале 20 века водители давили на газ, чтобы… остановиться

Автомобили марки De Dion-Bouton оснащались педалью деселератора

ТехИнсайдер
Коронные разряды превзошли грозовые облака по числу созданных радикалов-окислителей Коронные разряды превзошли грозовые облака по числу созданных радикалов-окислителей

Концентрация гидроксил-радикалов вблизи ЛЭП может увеличиться в сто раз

N+1
Труп, который обманул Гитлера Труп, который обманул Гитлера

Непридуманная шпионская история с неожиданным участием Йена Флеминга

Дилетант
Нужно ли чистить яблоки и насколько вредна кожура? Нужно ли чистить яблоки и насколько вредна кожура?

Нужно ли очищать яблоко от кожуры или иногда лучше этого не делать

ТехИнсайдер
Открыть в приложении