Способен ли искусственный интеллект писать тексты или даже мыслить как человек?

МонокльHi-Tech

Феномен текста: человек vs ИИ

При правильно написанном промпте рассказ, сгенерированный нейросетью последнего поколения, не отличить от человеческого. Но прежде чем доверить сочинение боту, разберемся в нюансах

Валерия Бунина

Все больше людей используют тексты, написанные искусственным интеллектом. Открытой статистики на этот счет не существует (данные засекречены разработчиками и операторами связи), но известно, что, например, в 2024 году мобильный трафик и аудитория сервисов ИИ в России выросли в пять раз. Прошлогоднее исследование компании «Яндекс» показало: к нейросетям для генерации текста обращается треть пользователей Рунета, причем доля аудитории от 45 до 54 лет и старше 55 лет растет.

Есть и яркий пример «генерационного бума»: в апреле этого года газета «Краснодарские известия» выпустила номер, полностью написанный ИИ. Перед началом работы нейросеть обучали на десятках журналистских материалов, чтобы адаптировать к стилю издания. В итоге в номере появились такие материалы, как статьи «Сгенерированный судья будущего» и «Они заменят вас на работе».

Давайте разберемся в этих предвестниках «креативной революции»: действительно ли искусственный интеллект способен писать тексты или даже мыслить как человек?

Банальность или странный креатив

Для начала стоит успокоиться: в отличие от людей ИИ не понимает слова, которые пишет, а просто отыскивает закономерности в миллионах текстов. В основе нейросети лежит языковая модель — алгоритм, обученный на большом количестве текстов. Опираясь на заданную фразу — контекст, — модель предсказывает наиболее логичную последовательность слов. Ключевая задача, которую при этом решают разработчики, — сделать результат максимально приближенным к написанному человеком.

Технически это называется авторегрессионной генерацией. Модель получает цепочку слов на вход и вычисляет, какое следующее слово наиболее релевантно. Например, фразу «Левитан был» можно продолжить так: «человеком», «художником», «подданным Российской империи». ИИ оценивает каждый вариант и выбирает лучший. Одни алгоритмы настроены так, что лучшим признается фраза с наиболее часто встречающимся продолжением для известного контекста (в этом случае возможности постоянной генерации новых тестов ограниченны, так как нейросеть движется по одной колее), другие ориентированы на случайный выбор наиболее популярных вариантов (тексты получаются более разнообразными).

После добавления каждого нового слова действие повторяется — и так до тех пор, пока не будет достигнут лимит длины или не будет сгенерирован специальный символ завершения. Иногда нейросеть выдает текст из 20 слов, иногда из 120 — все зависит от того, в какой последовательности расположатся слова-токены.

Описание заката на море. Два из этих текстов созданы чат-ботами — GPT-4 и Deepseek, а один — Константином Паустовским. Чувствуете разницу?

На созданный ИИ текст могут влиять параметры, которые задает пользователь, например уровень креативности. Чем он выше, тем чаще модель будет выбирать редкие токены, делая написанное менее предсказуемым, порой очень странным. В случае с Левитаном нейросеть при высоком уровне креативности выбрала бы не «художник», а «подданный».

Еще один параметр — повторяемость. Модели склонны повторять стилистические шаблоны: для имитации стиля определенного писателя применяются инструкции в промпте.

«Процесс генерации основан на статистических закономерностях: ИИ не понимает содержание, а угадывает, какое слово или фраза лучше всего подходят в данном контексте, опираясь на свои тренировочные данные, — рассказывает руководитель научной группы “Технологии персонализации” института AIRI Евгений Фролов. — За последние пять лет развитие ИИ в области написания текстов прошло колоссальный путь. Возьмем для примера GPT. В 2018 году модель GPT-2, обученная на 1,5 миллиарда параметров, могла генерировать связные, но часто бессмысленные или ограниченные тексты. GPT-3, появившийся в 2020 году, был обучен на 175 миллиардах — в 117 раз больше, чем у предыдущей модели. Его тексты стали более естественными, точными и разнообразными. Для GPT-4, по оценкам экспертов, использовалось от 500 миллиардов до двух триллионов параметров — теперь нейросеть пишет эссе, стихи и даже диалоги, которые порой сложно отличить от созданных человеком. Такой прорыв стал возможен по нескольким причинам: увеличение объема данных для обучения, совершенствование алгоритмов, например введение методов дообучения с подкреплением, рост вычислительных мощностей. Благодаря последним были внедрены и механизмы, позволяющие моделям учитывать обратную связь от пользователей для улучшения стиля и точности ответов. Так что сегодня ИИ не просто генерирует текст — он адаптируется к конкретным задачам».

Проверяй и проверяй

При этом эксперты признают, что все искусственно созданные тексты имеют общую уязвимость: их «гениальный автор» не понимает того, о чем пишет. Сочинения нейросети собраны как конструктор «Лего», а смысл им придает читающий. Именно поэтому ИИ иногда ошибается, или, как говорят специалисты, выдает галлюцинации.

«Например, вместо ожидаемого текста на русском модель может что-то написать на китайском. Частный пример галлюцинаций — ошибки в фактических данных, некорректные адреса, числовые идентификаторы, гиперссылки. Наиболее мощные модели допускают не так много ошибок, как нам кажется, — в основном они связаны с различными точными сведениями из узких областей. Да, откровенные галлюцинации иногда помогают идентифицировать ботов, но это не универсальный метод. Передовые модели пишут очень убедительные тексты, ошибки в них не очевидны и потому с большим трудом распознаются человеком», — поясняет сотрудник международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Был ли аншлюс ГДР? Был ли аншлюс ГДР?

Читаем новый единый учебник всеобщей истории для 11 класса

Дилетант
Самые крупные землетрясения в истории СССР и России Самые крупные землетрясения в истории СССР и России

Землетрясения, которые лишили крова тысячи людей в СССР и России

Maxim
Индийская космическая программа Индийская космическая программа

Планы, которые строит Индийская организация космических исследований ISRO

Наука и техника
Тихоходное транспортное средство: что такое и каким знаком обозначается Тихоходное транспортное средство: что такое и каким знаком обозначается

Что именно считается тихоходом и какие правила обгона действуют?

РБК
Нижний Новгород: без лишних слов Нижний Новгород: без лишних слов

Нижний Новгород – место, где «заезженные эпитеты» имеют право на жизнь

Вокруг света
Нарыли контент Нарыли контент

Звездные фермеры, которые учат выращивать урожай и разводить скот

RR Люкс.Личности.Бизнес.
На египетской картине нашли библейский синий На египетской картине нашли библейский синий

Из чего древние египтяне делали редкую краску — библейский синий

N+1
Квас vs кефир Квас vs кефир

Окрошка: история и секреты любимого освежающего русского супа

Лиза
Мужчины придут сами: почему ТЦ не пытаются привлечь самых перспективных покупателей Мужчины придут сами: почему ТЦ не пытаются привлечь самых перспективных покупателей

Каких покупателей стараются привлекать торговые центры?

Forbes
Параллельщики. Carwin — о главных ошибках при поиске машины за рубежом Параллельщики. Carwin — о главных ошибках при поиске машины за рубежом

Как отличить реального поставщика от хорошо замаскированного обманщика

РБК
Легенды со стрелками: 7 знаменитых часов в мире Легенды со стрелками: 7 знаменитых часов в мире

О десяти самых знаменитых часах, расположенных в разных частях нашего мира

ТехИнсайдер
Самые красивые заповедники России Самые красивые заповедники России

Российские заповедники, отличающиеся необычайной красотой

ТехИнсайдер
Биометрия без «дублера» незаконна Биометрия без «дублера» незаконна

Полным ходом идет внедрение биометрии. Однако, лишение свободы выбора незаконно

Монокль
Фокус внимания Фокус внимания

Разговор с актрисой Лизой Шакирой о вере, надежде и любви

OK!
Узнайте 10 популярных ошибок, которые портят вкус вашего сэндвича! Узнайте 10 популярных ошибок, которые портят вкус вашего сэндвича!

Ошибки, которые портят даже самый свежий и вкусный бутерброд

ТехИнсайдер
Александр Лабас: не авангардист, не соцреалист Александр Лабас: не авангардист, не соцреалист

Голос А. Лабаса — сложный, полифоничный, подчас ускользающий от прямых смыслов

Монокль
«Моя цель не деньги!» «Моя цель не деньги!»

Как развивался и развивается рынок реверс-инжиниринга и при чем здесь китайцы

Монокль
Чёрные мысли на белом снегу Чёрные мысли на белом снегу

Рассказ Елены Ворон «Чёрные мысли на белом снегу»

Наука и жизнь
Вера Васильева: «Я ничего специально не делаю, живу как хочется» Вера Васильева: «Я ничего специально не делаю, живу как хочется»

Ее взлет в кино был ярким и мощным, а годы в профессии — разными, трудными...

Караван историй
Про пропан Про пропан

Если газ сжиженный, то он всё-таки ещё газ или уже жидкость?

Наука и жизнь
Субмарининг в отношениях: когда партнер исчезает и появляется как подводная лодка Субмарининг в отношениях: когда партнер исчезает и появляется как подводная лодка

Субмарининг: что это такое и почему люди так себя ведут?

VOICE
Через санкции к росту Через санкции к росту

Как российская экономика ищет способы сотрудничества с глобальными игроками

Эксперт
Рабби Давид из люфтваффе Рабби Давид из люфтваффе

В 2019 году Бундестаг одобрил введение в Германии военного раввината

Дилетант
Путь Карлито: как Карлос Алькарас стал зарабатывать более $40 млн в год Путь Карлито: как Карлос Алькарас стал зарабатывать более $40 млн в год

Роль в развитии Карлоса Алькараса его агента и умении располагать к себе фанатов

Forbes
8 вещей, которые нельзя хранить под кроватью 8 вещей, которые нельзя хранить под кроватью

Есть вещи, которые лучше держать подальше от подкроватья

VOICE
Дейнотерий – слон с берегов Дона Дейнотерий – слон с берегов Дона

Слоны – одни из самых стабильных в эволюционном плане животных...

Наука и техника
От Шагала до мурала От Шагала до мурала

Арт-маршрут от Ниццы до Перпиньяна, достойный целых каникул

Y Magazine
Что открыть в нежилом помещении: топ-5 бизнес-идей Что открыть в нежилом помещении: топ-5 бизнес-идей

Под какой бизнес можно сдать нежилое помещение, чтобы получать прибыль?

Inc.
Тело знает всё Тело знает всё

Ида Галич — о том, почему важно слушать свое тело и как это делать

Новый очаг
15 уроков периода высоких ставок глазами банкира 15 уроков периода высоких ставок глазами банкира

Что мы поняли за годы высоких ставок?

Ведомости
Открыть в приложении