Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Чистое золото Чистое золото

В компании «Полиметалл» добывают золото без вреда для природы

ТехИнсайдер
Наш паровоз вперед летит Наш паровоз вперед летит

Одна из новинок проката — фильм режиссера Андрея Волгина «Красный шелк»

Монокль
Карбон звучащий Карбон звучащий

Из карбона теперь делают музыкальные инструменты

Популярная механика
7 поломок, которые чаще всего случаются весной. О чем стоит знать заранее 7 поломок, которые чаще всего случаются весной. О чем стоит знать заранее

На какие детали и узлы автомобиля нужно обратить особое внимание весной

РБК
Твой персональный код Твой персональный код

Какими бывают тесты ДНК

Популярная механика
У бонобо нашли вокальные диалекты У бонобо нашли вокальные диалекты

Ученые сравнили вокализации бонобо из трех разных зоопарков

N+1
Токеномика Токеномика

Первый в мире анимационный NFT-сериал Take My Muffin

Популярная механика
7 вещей, которые никогда не делают счастливые люди 7 вещей, которые никогда не делают счастливые люди

Эксперт по счастью: 7 вещей, которые никогда не делают счастливые люди

Inc.
Еда, которая не убивает планету Еда, которая не убивает планету

Прокормить постоянно растущее человечество помогут микроорганизмы

ТехИнсайдер
Есть контакт Есть контакт

Как установить и почувствовать связь со своим телом

Grazia
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Символ на перекрестке современных философий Символ на перекрестке современных философий

Знак — это условность, которая превращает отдельные вещи в их меру

Знание – сила
3500 км по Индии: Без карты. Без путеводителя. На трех колесах 3500 км по Индии: Без карты. Без путеводителя. На трех колесах

О незабываемых приключениях в Индии от первого лица

Playboy
Скажи мне, что ты ешь Скажи мне, что ты ешь

Как продукты, которые мы предпочитаем, могут раскрыть характер?

Лиза
Планета номер Икс Планета номер Икс

Гипотетическую девятую планету до сих пор не увидели ни в один телескоп

ТехИнсайдер
Партнер-провокатор: что стоит за его манипуляциями и как реагировать правильно Партнер-провокатор: что стоит за его манипуляциями и как реагировать правильно

Как вычислить манипуляцию провокацией и как правильно реагировать на нее

Psychologies
Метавселенные Метавселенные

Главная технология и тренд этого года – виртуальные вселенные, или метавселенные

Популярная механика
«Чистейший образец» «Чистейший образец»

Составить цельный образ Натальи Николаевны Гончаровой — сложная задача

Дилетант
В темноте и за углом В темноте и за углом

Зрение военного времени

Популярная механика
Дэн Браун Дэн Браун

Правила жизни писателя Дэна Брауна

Правила жизни
Пятиминутный путеводитель по теориям заговоров Пятиминутный путеводитель по теориям заговоров

Пять основных направлений полета конспирологической мысли

Правила жизни
«Перемолотый край, где сопки нетронуты, а долины истерзаны» «Перемолотый край, где сопки нетронуты, а долины истерзаны»

Желание восстановить историю семьи может привести к историческому расследованию

Дилетант
Танцы в Аничковом Танцы в Аничковом

При дворе Николая I светские законы сочетались с военным уставом

Дилетант
«Актив на самом деле уникальный» «Актив на самом деле уникальный»

Кирилл Ершов — о развитии подконтрольной холдингу компании «Ростагро»

Агроинвестор
Мюзикальная сказка Стамбула Мюзикальная сказка Стамбула

Увидеть дворец султана Сулеймана, колоритный восточный базар и величие Босфора

ЖАРА Magazine
Не за что судить Не за что судить

Тайны советского туризма 70-х: почему некоторые не возвращались из походов?

Дилетант
Семь лет спустя Семь лет спустя

Каким был брак Натальи Пушкиной с Петром Ланским, небогатым армейским офицером?

Дилетант
Шеф — поставщик: здесь и сейчас Шеф — поставщик: здесь и сейчас

Как в разных регионах находят необычные продукты и превращают в уникальные блюда

Bones
Женский бег с препятствиями Женский бег с препятствиями

Женщины Древней Греции и Спарты: спорт как способ борьбы за свободу и права

Знание – сила
Умереть по-христиански Умереть по-христиански

«Мы насилу довели его до смерти христианской»

Дилетант
Открыть в приложении