Творческая единица: почему у ИИ получаются плохие стихи и чем он страшен писателям

Кристина Крецу

В середине января молодая японская писательница Рие Кудан, получившая престижную литературную премию Акутагавы за книгу «Токийская башня сочувствия», без стеснений заявила, что писала эту работу с помощью генеративного ИИ. При этом она уточнила, что ChatGPT является «автором» примерно 5% текста книги, а к искусственному интеллекту она прибегает, в основном, для «высвобождения творческой энергии». Может ли ИИ составить конкуренцию представителям творческих профессии, например, поэтам и писателям, или даже заменить их — в материале Forbes.

В середине января молодая японская писательница Рие Кудан, получившая престижную литературную премию Акутагавы за книгу «Токийская башня сочувствия», без стеснений заявила, что писала эту работу с помощью генеративного ИИ. Она, правда, уточнила, что ChatGPT является «автором» примерно 5% текста книги, а в основном она прибегает к искусственному интеллекту для «высвобождения творческой энергии».

Эта новость широко разошлась по литературным и технологическим СМИ, придав новый импульс дискуссии о том, может ли ИИ заниматься творчеством и насколько новые технологии угрожают творческим профессиям — таким как поэты, сценаристы, музыканты и писатели. Угроза со стороны искусственного интеллекта стала одной из самых горячих тем на недавней Франкфуртской книжной ярмарке.

Не все демонстрируют такую умеренность в использовании ИИ, как юная японская писательница. Проблема бесконтрольных продаж книг, созданных нечеловеческим разумом, достигла таких масштабов, что Amazon ввел новые ограничения для продаж самостоятельно издаваемых книг, написанных для Kindle — теперь их можно продавать не больше трех в день.

До того, как в нашу жизнь ворвался ChatGPT, которым массово начали пользоваться добросовестные и не очень писатели, студенты и юристы, было принято считать, что умение создавать — главное, что отличает человека от машины. Однако новый тип искусственного интеллекта (ИИ) — генеративный — уже поставил уникальность человеческого сознания под сомнение.

Мы переходим от эпохи, где ИИ в основном использовался для понимания больших данных, к новой — к той, где ИИ используется для создания контента. Но действительно ли машина на такое способна? «Аналитическая машина не претендует на создание чего-либо. Она может делать все, что мы можем ей предписать. Ее задача — помочь нам сделать доступным то, с чем мы уже знакомы», — говорила Ада Лавлейс, создательница первой в мире компьютерной программы. Ее слова все еще актуальны, так как генеративный ИИ — это алгоритмы, обучившиеся на огромном количестве данных. Любой результат их работы — это последствие анализа информации.

Как научить нейросети творчеству

Некоторые исследователи определяют креативность как процесс, который приводит к созданию новой и полезной идеи или продукта. Поэтому один из критериев, по которому оценивают креативность — уровень новизны. Однако это субъективное понятие, на основе которого сложно получить четкую измерительную шкалу.

В 2018 году на аукционе Christie's портрет Эдмона де Белами, написанным ИИ, продали за $432 500. Это почти в 45 раз превышает максимальную оценку произведения. Объективно авторство этой работы принадлежит тем, кто курировал работу ИИ, — арт-группе Obvious. Команда собрала базу данных изображений, написала алгоритм и обучила нейросеть, чтобы получить тот результат, который и представили на аукционе. Это и отличает творчество ИИ от человеческого — оно носит систематический, а не импульсивный характер, как это свойственно людям.

Люди, для которых придумывать — это профессия, используют множество техник креативного мышления: мозговой штурм, ТРИЗ (теория решения изобретательских задач), латеральное мышление, дизайн-мышление и другие. Задача этих методик — помочь придумать оригинальную идею, найти новое решение и в целом форсировать креативность. Может ли искусственный интеллект использовать такие же подходы? Сложно сказать, потому что в своем текущем состоянии нейросети для человека — это черный ящик, пишет Nature, никто пока точно не знает, как именно происходят вычисления.

Все современные GPT-подобные модели созданы для того, чтобы имитировать чей-то стиль, и лучшего всего у них получается систематизировать огромное количество информации. Например, им неплохо удается писать новости, обзоры, сопроводительные письма и другого типа тексты, от которых требуется соответствие стандартным шаблонам. Но чем дальше развивается ИИ, тем больше компании ждут от него чего-то творческого. Однако легальных данных для обучения не так уж много.

В августе 2023 года на The Atlantic опубликовали расследование о том, что крупные компании используются пиратские источники для обучениях своих нейросетей. В июле того же года писатели Сара Сильверман, Ричард Кадри и Кристофер Голден подали иск, в котором утверждают, что Meta (признана в России экстремистской и запрещена) нарушила законы об авторском праве и использовала их книги для обучения своей большой языковой модели LLaMA (аналог GPT-4). Расследование журналиста Алекса Райснера показало, что компания действительно использовала пиратские книги в качестве исходных данных для обучения своих нейросетей — эта база называется Books3. Она содержит более 190 000 произведений. Правда, в ноябре судья отклонил иск писателей, сказав, что не нашел достаточно подтверждений, что модель использует именно их работы.

Так или иначе, не исключено, что череда исков от писателей стала одной из причин, по которым IT-компании начали нанимать поэтов, писателей, драматургов со степенью PhD или магистра, чтобы обучать нейросети. Стартап Scale AI, специализирующийся на создании датасетов, в своей вакансии пишет, что среди обязанностей писателя будут ранжирование ответов, полученных от ИИ, а также написание небольших рассказов по заданной теме. За это обещают платить $25–50 в час в зависимости от уровня образования и опыта. Специалиста с аналогичными обязанностями искал недавно стартап Appen, который занимается разметкой данных.

Но это также может свидетельствовать о новой эре развития LLM (large language model, большая языковая модель): компании переходят от этапа создания к точечной настройке для конкретных приложений, то есть теперь «общие» LLM начинают тренировать под конкретный навык. И для этого, конечно, снова нужны данные.

Точечная настройка (fine-tuning) LLM позволяет предварительно обученную модель, которая уже знает некоторые закономерности в большом наборе данных, дообучить на меньшем наборе данных, специфичном для конкретной области. В перспективе это поможет нейросетям выполнять определенные задачи лучше своих «коллег» общего назначения. Например, можно попытаться научить нейросеть имитировать конкретно стиль Александра Пушкина, Шекспира или Джоан Роулинг.