Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Битва промптов Битва промптов

Баттл «промпт-инженер против обычного человека с нейросетью»

ТехИнсайдер
Нейробиолог назвал привычку, объединяющую гениев. А у вас она есть? Нейробиолог назвал привычку, объединяющую гениев. А у вас она есть?

Настоящий прорыв мысли начинается в тишине и одиночестве

Maxim
11 друзей Кандинского 11 друзей Кандинского

Какие игроки доминируют на глобальном рынке нейросетей, каковы их планы?

РБК
Почему телефон долго заряжается: 8 самых популярных причин Почему телефон долго заряжается: 8 самых популярных причин

Все случаи, следствием которых может стать медленная зарядка аккумулятора

CHIP
Антигон Одноглазый Антигон Одноглазый

Антигон Одноглазый: великий полководец и дипломат, которого погубила алчность

Дилетант
Минута славы Минута славы

Как снимать в путешествиях видео, которые станут популярными в соцсетях

Лиза
«Теперь лето, и прелестное лето, и я ошалеваю от радости плотской жизни» «Теперь лето, и прелестное лето, и я ошалеваю от радости плотской жизни»

Великие о том, как они проводили каникулы

Weekend
Отключили мобильный интернет: новая реальность российского цифрового пространства Отключили мобильный интернет: новая реальность российского цифрового пространства

Кто страдает от отключений интернета и как бизнесу адаптироваться к этому

Inc.
Эта привычка может повысить риск развития деменции на 43% Эта привычка может повысить риск развития деменции на 43%

Употребление большого количества сахара может повысить риск развития деменции

ТехИнсайдер
В режиме «не беспокоить»: что такое синдром цифровой усталости, чем он опасен и как с ним бороться В режиме «не беспокоить»: что такое синдром цифровой усталости, чем он опасен и как с ним бороться

Как зумеры столкнулись с выгоранием от бесконечного скроллинга социальных сетей

Правила жизни
Каннибалы 5600 лет назад съели в Атапуэрке 11 человек Каннибалы 5600 лет назад съели в Атапуэрке 11 человек

Ученые проанализировали многочисленные человеческие кости из пещеры Эль-Мирадор

N+1
Что такое DDoS-атака и как она работает Что такое DDoS-атака и как она работает

Объясняем, что такое DDoS и как оно работает

ТехИнсайдер
В своем праве В своем праве

Как вернуть деньги за некачественный товар или услугу

Лиза
Лучшие современные сериалы до 10 серий Лучшие современные сериалы до 10 серий

Сериалы до 10 серий: идеальный вариант для выходных или вечера

Maxim
На двух софтах На двух софтах

Почему российские компании продолжают работать на смешанном софте

Ведомости
Чем закусывать Jagermeister Чем закусывать Jagermeister

Копченое, кислое и сладкое — чем закусывать немецкую знаменитую настойку?

Maxim
Точное определение Точное определение

От идеи журналиста до легенды футбола: история Суперкубка УЕФА

Ведомости
Как ожидаемое вознаграждение управляет вниманием и решением человека Как ожидаемое вознаграждение управляет вниманием и решением человека

Концентрация внимания и выбор решения контролируются разными областями мозга

ТехИнсайдер
Может, чайку? Может, чайку?

Русское чаепитие: легенды, правила и советы, которые пригодятся и сегодня

Лиза
Одежда-антистресс Одежда-антистресс

Что включить в дофаминовый гардероб

Лиза
Как выбрать фильтр для воды? Есть всего два важных параметра Как выбрать фильтр для воды? Есть всего два важных параметра

Разбираемся, как выбрать идеальную систему очистки воды

ТехИнсайдер
«Год Черной Обезьяны»: семейная сага о первых постсоветских десятилетиях «Год Черной Обезьяны»: семейная сага о первых постсоветских десятилетиях

Отрывок из романа-размышления о том, как прошлое определяет будущее

Forbes
Почему в некоторых озерах вода розового цвета? Почему в некоторых озерах вода розового цвета?

Почему по всему миру можно найти розовые озера?

ТехИнсайдер
Торговые войны на металлическом фундаменте Торговые войны на металлическом фундаменте

Мировой рынок металлов переживает историческую трансформацию

Ведомости
Ох уж эти детки Ох уж эти детки

Звездные мамы и папы рассказали, чему научились у своих детей

Grazia
Невидимая опасность Невидимая опасность

Что делать, чтобы не подхватить грибок?

Лиза
Кто живет на чердаке Кто живет на чердаке

Как оформить квартиру в стиле лофт, не ломая стены

Лиза
Без паники Без паники

Как не дать гиперответственности превратить жизнь в постоянный стресс

Лиза
Виниры и люминиры: чем отличаются и что выбрать Виниры и люминиры: чем отличаются и что выбрать

Чем виниры и люминиры отличаются между собой и что из них надежнее

ТехИнсайдер
Огненный гигант: какой вулкан самый большой в мире Огненный гигант: какой вулкан самый большой в мире

Какой вулкан считается самым высоким, самым большим, самым опасным, самым-самым?

ТехИнсайдер
Открыть в приложении