Способен ли искусственный интеллект писать тексты или даже мыслить как человек?

МонокльHi-Tech

Феномен текста: человек vs ИИ

При правильно написанном промпте рассказ, сгенерированный нейросетью последнего поколения, не отличить от человеческого. Но прежде чем доверить сочинение боту, разберемся в нюансах

Валерия Бунина

Все больше людей используют тексты, написанные искусственным интеллектом. Открытой статистики на этот счет не существует (данные засекречены разработчиками и операторами связи), но известно, что, например, в 2024 году мобильный трафик и аудитория сервисов ИИ в России выросли в пять раз. Прошлогоднее исследование компании «Яндекс» показало: к нейросетям для генерации текста обращается треть пользователей Рунета, причем доля аудитории от 45 до 54 лет и старше 55 лет растет.

Есть и яркий пример «генерационного бума»: в апреле этого года газета «Краснодарские известия» выпустила номер, полностью написанный ИИ. Перед началом работы нейросеть обучали на десятках журналистских материалов, чтобы адаптировать к стилю издания. В итоге в номере появились такие материалы, как статьи «Сгенерированный судья будущего» и «Они заменят вас на работе».

Давайте разберемся в этих предвестниках «креативной революции»: действительно ли искусственный интеллект способен писать тексты или даже мыслить как человек?

Банальность или странный креатив

Для начала стоит успокоиться: в отличие от людей ИИ не понимает слова, которые пишет, а просто отыскивает закономерности в миллионах текстов. В основе нейросети лежит языковая модель — алгоритм, обученный на большом количестве текстов. Опираясь на заданную фразу — контекст, — модель предсказывает наиболее логичную последовательность слов. Ключевая задача, которую при этом решают разработчики, — сделать результат максимально приближенным к написанному человеком.

Технически это называется авторегрессионной генерацией. Модель получает цепочку слов на вход и вычисляет, какое следующее слово наиболее релевантно. Например, фразу «Левитан был» можно продолжить так: «человеком», «художником», «подданным Российской империи». ИИ оценивает каждый вариант и выбирает лучший. Одни алгоритмы настроены так, что лучшим признается фраза с наиболее часто встречающимся продолжением для известного контекста (в этом случае возможности постоянной генерации новых тестов ограниченны, так как нейросеть движется по одной колее), другие ориентированы на случайный выбор наиболее популярных вариантов (тексты получаются более разнообразными).

После добавления каждого нового слова действие повторяется — и так до тех пор, пока не будет достигнут лимит длины или не будет сгенерирован специальный символ завершения. Иногда нейросеть выдает текст из 20 слов, иногда из 120 — все зависит от того, в какой последовательности расположатся слова-токены.

Описание заката на море. Два из этих текстов созданы чат-ботами — GPT-4 и Deepseek, а один — Константином Паустовским. Чувствуете разницу?

На созданный ИИ текст могут влиять параметры, которые задает пользователь, например уровень креативности. Чем он выше, тем чаще модель будет выбирать редкие токены, делая написанное менее предсказуемым, порой очень странным. В случае с Левитаном нейросеть при высоком уровне креативности выбрала бы не «художник», а «подданный».

Еще один параметр — повторяемость. Модели склонны повторять стилистические шаблоны: для имитации стиля определенного писателя применяются инструкции в промпте.

«Процесс генерации основан на статистических закономерностях: ИИ не понимает содержание, а угадывает, какое слово или фраза лучше всего подходят в данном контексте, опираясь на свои тренировочные данные, — рассказывает руководитель научной группы “Технологии персонализации” института AIRI Евгений Фролов. — За последние пять лет развитие ИИ в области написания текстов прошло колоссальный путь. Возьмем для примера GPT. В 2018 году модель GPT-2, обученная на 1,5 миллиарда параметров, могла генерировать связные, но часто бессмысленные или ограниченные тексты. GPT-3, появившийся в 2020 году, был обучен на 175 миллиардах — в 117 раз больше, чем у предыдущей модели. Его тексты стали более естественными, точными и разнообразными. Для GPT-4, по оценкам экспертов, использовалось от 500 миллиардов до двух триллионов параметров — теперь нейросеть пишет эссе, стихи и даже диалоги, которые порой сложно отличить от созданных человеком. Такой прорыв стал возможен по нескольким причинам: увеличение объема данных для обучения, совершенствование алгоритмов, например введение методов дообучения с подкреплением, рост вычислительных мощностей. Благодаря последним были внедрены и механизмы, позволяющие моделям учитывать обратную связь от пользователей для улучшения стиля и точности ответов. Так что сегодня ИИ не просто генерирует текст — он адаптируется к конкретным задачам».

Проверяй и проверяй

При этом эксперты признают, что все искусственно созданные тексты имеют общую уязвимость: их «гениальный автор» не понимает того, о чем пишет. Сочинения нейросети собраны как конструктор «Лего», а смысл им придает читающий. Именно поэтому ИИ иногда ошибается, или, как говорят специалисты, выдает галлюцинации.

«Например, вместо ожидаемого текста на русском модель может что-то написать на китайском. Частный пример галлюцинаций — ошибки в фактических данных, некорректные адреса, числовые идентификаторы, гиперссылки. Наиболее мощные модели допускают не так много ошибок, как нам кажется, — в основном они связаны с различными точными сведениями из узких областей. Да, откровенные галлюцинации иногда помогают идентифицировать ботов, но это не универсальный метод. Передовые модели пишут очень убедительные тексты, ошибки в них не очевидны и потому с большим трудом распознаются человеком», — поясняет сотрудник международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не ставьте крест на инфраструктурных облигациях Не ставьте крест на инфраструктурных облигациях

Где искать рыночный механизм финансирования больших стратегических проектов?

Монокль
В ответе за тех, в кого вложили В ответе за тех, в кого вложили

Новый кодекс ЦБ поможет институциональным инвесторам активнее влиять на компании

Ведомости
Узнать за 60 секунд Узнать за 60 секунд

Почему мы стремимся ускорить все процессы и как это влияет на наш мозг

Men Today
На египетской картине нашли библейский синий На египетской картине нашли библейский синий

Из чего древние египтяне делали редкую краску — библейский синий

N+1
Он лгал и учил лгать Он лгал и учил лгать

«Мы не знаем страны, в которой живем». А знаем ли мы Юрия Андропова?

Дилетант
Что будет в небе после МКС Что будет в небе после МКС

Через пять лет над Землёй будут работать станции разных стран, а не одна МКС

Монокль
Накопительную часть пенсии «молчунов» могут перевести в ПДС автоматически Накопительную часть пенсии «молчунов» могут перевести в ПДС автоматически

О существенных изменениях для инвесторов и клиентов банков и финансовых компаний

Деньги
«Если какие сложности, основной груз на мне»: как женщины воспитывают приемных детей «Если какие сложности, основной груз на мне»: как женщины воспитывают приемных детей

Forbes Woman исследовал гендерные аспекты приемного родительства

Forbes
Техно реализм Техно реализм

К чему ведут нас гаджеты и как революция в коммуникациях влияет на творчество

Правила жизни
«Поел морковки и пожелтел»: какие витамины нам не нужны «Поел морковки и пожелтел»: какие витамины нам не нужны

Какими рисками чревато расхожее «попей витаминчиков», откуда взялась эта мода?

РБК
Пример заразителен Пример заразителен

Как гаджеты могут стать наркотиком и почему их не стоит обвинять во всех бедах

Правила жизни
«Мы уже не живем в своей колыбели» «Мы уже не живем в своей колыбели»

Чем дышит и живет Институт космических исследований РАН?

Знание – сила
Червивое яблоко Червивое яблоко

Все оказалось просто. Иллюзорно просто. И это усыпило внимание большинства

Правила жизни
Фокус внимания Фокус внимания

Разговор с актрисой Лизой Шакирой о вере, надежде и любви

OK!
Москва на экране Москва на экране

Почему регионы готовы доплачивать за съемки фильмов на своей территории

Эксперт
Кнут Гамсун Кнут Гамсун

Кнут Гамсун говорил от имени нации и тем сильно её скомпрометировал

Дилетант
Сервис с самой низкой комиссией — это ловушка: 4 частые ошибки при выборе платежного агента Сервис с самой низкой комиссией — это ловушка: 4 частые ошибки при выборе платежного агента

Какие ошибки чаще всего допускает бизнес при выборе платежного агента

Inc.
Зоологи подтвердили крайнюю редкость рака у черепах Зоологи подтвердили крайнюю редкость рака у черепах

Почему злокачественные опухоли редко встречаются у черепах

N+1
Что такое поликарьера и чем она отличается от подработки Что такое поликарьера и чем она отличается от подработки

Горизонтальный рост: что такое поликарьера и кому она подходит

Ведомости
«Дешевый» клиент почти всегда сложнее «дорогого»: как работать с придирчивыми заказчиками «Дешевый» клиент почти всегда сложнее «дорогого»: как работать с придирчивыми заказчиками

Как сразу определить, что клиент сложный, а когда лучше отказаться от проекта?

Inc.
Почему понедельник – самый опасный день недели? Дело не только в работе Почему понедельник – самый опасный день недели? Дело не только в работе

Статистика неумолима: именно на понедельник приходится пик сердечных приступов

Inc.
Тело знает всё Тело знает всё

Ида Галич — о том, почему важно слушать свое тело и как это делать

Новый очаг
Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции Карманные мозги, что управляют всем: микроконтроллеры от первых 4-бит до IoT-революции

История микроконтроллеров от их зарождения до современных тенденций

Наука и техника
Команда спасателей Команда спасателей

Справляемся с отпускными кризисными бьюти-ситуациями

Moodboard
Александр Лабас: не авангардист, не соцреалист Александр Лабас: не авангардист, не соцреалист

Голос А. Лабаса — сложный, полифоничный, подчас ускользающий от прямых смыслов

Монокль
«Моя цель не деньги!» «Моя цель не деньги!»

Как развивался и развивается рынок реверс-инжиниринга и при чем здесь китайцы

Монокль
«Британский Шиндлер»: история Николаса Уинтона, спасшего 669 детей от нацистов «Британский Шиндлер»: история Николаса Уинтона, спасшего 669 детей от нацистов

Николаса Уинстона, британского филантропа, не просто так называют «Шиндлером»

ТехИнсайдер
В такси на Дубровку В такси на Дубровку

Ищешь живописное место для фотосессии? Советские фильмы знают ответ!

Лиза
Знать без царя в голове Знать без царя в голове

Мини-сериал о сестрах Митфорд, которые искали любовь, а нашли политику

Weekend
Кадры заколебались Кадры заколебались

Ротация высших региональных чиновников вернулась к стандартному уровню

Ведомости
Открыть в приложении