Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Семь лайфхаков для бодрого утра Семь лайфхаков для бодрого утра

Даже если вы не жаворонок, можно вставать по утрам легко и с удовольствием

Здоровье
О чем хотят сказать наши неловкости О чем хотят сказать наши неловкости

Случайные на первый взгляд, наши оплошности и промахи говорят многое о нас

Psychologies
Исследователи MIT разработали микроробота, который может вести Исследователи MIT разработали микроробота, который может вести

Чем лучше мы сможем рассмотреть живую клетку, тем лучше мы поймем, как ей помочь

ТехИнсайдер
От Пхеньяна до Сеула. И обратно От Пхеньяна до Сеула. И обратно

Ситуация на фронтах Корейской войны менялась с калейдоскопической скоростью

Дилетант
Кодекс выбора парфюма: как купить новые духи и не разочароваться Кодекс выбора парфюма: как купить новые духи и не разочароваться

На что именно нужно ориентироваться, чтобы выбрать на 100% твои духи

VOICE
Вот как определить уровень автономности автомобиля: простой способ Вот как определить уровень автономности автомобиля: простой способ

На шкале автономного вождения, состоящей из шести уровней, ваша ласточка есть

ТехИнсайдер
Как правильно спать — на спине, на боку, на животе? И что нужно делать, чтобы просыпаться отдохнувшим и полным сил? Как правильно спать — на спине, на боку, на животе? И что нужно делать, чтобы просыпаться отдохнувшим и полным сил?

Существует ли научный способ подобрать позу для сна, которая будет идеальна?

ТехИнсайдер
Как перестать все забывать: простые способы улучшить память Как перестать все забывать: простые способы улучшить память

Можно ли натренировать память?

ТехИнсайдер
Хигураси Хигураси

Анаит Григорян не только посол японской культуры в русскоязычной литературе

Правила жизни
Идти в глубину Идти в глубину

Таня водит в походы, учит плаванию и своим примером говорит: Да, так тоже можно

Seasons of life
10 способов относиться к себе проще 10 способов относиться к себе проще

Как перестать требовать от себя слишком многого?

Psychologies
Группа «Буерак» — об альбоме «Музей устаревшего искусства», фанатах из Мексики и мемах о себе Группа «Буерак» — об альбоме «Музей устаревшего искусства», фанатах из Мексики и мемах о себе

Группа «Буерак» — о популярности в Мексике и когда стоит слушать их музыку

СНОБ

В есенинскую ловушку попал ни один десяток одиноких и замужних девушек

ТехИнсайдер
Самые живучие мифы повседневной жизни, в которые все верят несмотря ни на что Самые живучие мифы повседневной жизни, в которые все верят несмотря ни на что

После бритья волосы будут гуще и длиннее, а читать в темноте вредно?

Maxim
Окаменелые фекалии доказали, что люди начали одомашнивать скот на 2000 лет раньше, чем считали ученые Окаменелые фекалии доказали, что люди начали одомашнивать скот на 2000 лет раньше, чем считали ученые

Возможно, люди приручили животных раньше, чем растения

ТехИнсайдер
Древняя история шоколада: как появилась самая популярная сладость в мире Древняя история шоколада: как появилась самая популярная сладость в мире

Где родина шоколада и как вышло, что он так удачно влился в мировую культуру?

ТехИнсайдер
Дело не в лени: 7 признаков того, что стоит обсудить отсутствие энергии со специалистом Дело не в лени: 7 признаков того, что стоит обсудить отсутствие энергии со специалистом

Все ли, что кажется ленью, — действительно лень? И стоит ли ругать себя за нее?

Psychologies
Елизавета II, автомеханик на престоле Елизавета II, автомеханик на престоле

Королеву Елизавету вспоминает бывший посол РФ в Великобритании

Дилетант
Легендарные мотоциклы СССР: дорога от Легендарные мотоциклы СССР: дорога от

Мотоциклетных заводов в СССР было не меньше, чем автомобильных

ТехИнсайдер
«Сифилизатор» из СССР: история тех самых советских автоматов с газировкой и граненым стаканом «Сифилизатор» из СССР: история тех самых советских автоматов с газировкой и граненым стаканом

Давайте поднимем стакан «Дюшеса» в память о советских автоматах с газировкой

ТехИнсайдер
Пассивная система охлаждения в ноутбуках: это хорошо или плохо? Пассивная система охлаждения в ноутбуках: это хорошо или плохо?

Ноутбуки с пассивной системой охлаждения — что это за «зверь»?

CHIP
MacBook против ноутбука на Windows: как выбрать между ними? MacBook против ноутбука на Windows: как выбрать между ними?

Дебаты о MacBook и ноутбуках на Windows ведутся десятилетиями

ТехИнсайдер
Призрак монархии: как воспринимали Елизавету II в российском обществе Призрак монархии: как воспринимали Елизавету II в российском обществе

Королева Елизавета II была для россиян самым известным современным монархом

Forbes
Лариса Голубкина: Лариса Голубкина:

Я ощущала внутреннюю окрыленность и не собиралась ее терять

Коллекция. Караван историй
«Умный, но ленивый»: почему школьник не хочет ничего делать «Умный, но ленивый»: почему школьник не хочет ничего делать

Как разобраться, почему ребенок отлынивает от дел?

Psychologies
Преобразовать страх в интерес: как побороть неуверенность в себе Преобразовать страх в интерес: как побороть неуверенность в себе

Откуда берется неуверенность в себе, чем она отличается от низкой самооценки

Forbes
Документальные фильмы, которые страшнее любого ужастика Документальные фильмы, которые страшнее любого ужастика

Отбрось стереотип, что документалки — это скукота для зануд

Maxim
Жан-Люк Годар: гид по творчеству великого режиссера, изменившего кино Жан-Люк Годар: гид по творчеству великого режиссера, изменившего кино

Как подобраться к творчеству Жана-Люка Годара?

Правила жизни
Школа для учителя, или Тонкости инклюзивного образования Школа для учителя, или Тонкости инклюзивного образования

Как устроить в школу преподавателя с особенностями здоровья

СНОБ
Самый жестокий маньяк Японии: история «убийцы с руками вампира» Цутому Миядзаки Самый жестокий маньяк Японии: история «убийцы с руками вампира» Цутому Миядзаки

Люди не могли поверить, что существует настолько жестокий монстр

VOICE
Открыть в приложении