Поговори мне тут: как происходит революция в мире ИИ
В последние месяцы в мире высоких технологий начался очередной качественно новый этап развития. Нейросети поумнели настолько, что стали уж очень походить на людей — в контенте, творчестве и разговорах. Рассказываем, с чем это связано
Недавно снимок с дрона, на котором пойманы два несущихся навстречу друг другу серфера, был признан лучшим на фотоконкурсе компании DigiDirect. Эксперты сочли его достойным главного приза, однако победитель от награды отказался — на самом деле кадр был сгенерирован нейросетью.
Многие эксперты сходятся во мнении, что уже сейчас мы находимся в переломном моменте. Уровень создания «человеческого» контента — картин, фото, видео, текстов, музыки — стал настолько высоким, что даже эксперты не могут отличить творение нейросети от «настоящего». Другой пример: американские актеры озвучки обеспокоены тем, что генеративные нейросети лишат их работы. При подписании контракта актеры все чаще встречаются с тем, что в договор включен пункт об использовании голоса для компьютерного синтеза. Для обучения нейросети достаточно всего несколько часов записанной речи, и после этого актер практически не контролирует, что будет озвучено его синтезированным голосом.
Но это только видимая верхушка айсберга. Мощное развитие стало угрозой классическим поисковым технологиям: новое поколение основанных на искусственном интеллекте (ИИ) чат-ботов дает простые ответы на большинство вопросов пользователей, не предусматривая при этом онлайн-рекламы.
Самый яркий представитель таковых — чат-бот ChatGPT, выпущенный исследовательской лабораторией OpenAI. Эта система дает простые и понятные ответы на пользовательские вопросы, не ограничиваясь набором ссылок и «гуглением», как это делают, например, «Алиса», «Маруся» и другие помощники.
GPT — это аббревиатура, которая расшифровывается как generative pre-trained transformer. Суть таких моделей в следующем: по входному тексту они генерируют наиболее релевантное продолжение. Учатся такие модели на фиксированном объеме текстов: сюда входят интернет-ресурсы типа Wikipedia, Stackoverflow, книги и другие источники.
Система решает конкретную задачу генерации текста, и у нее нет предсказательной способности. Поэтому она не подскажет будущее значение индекса S&P500 или курса биткоина, а если и сгенерирует правдоподобный текст, то лучше к нему не прислушиваться как к инвестиционным советам. Но модель может, например, помочь с генерацией различных идей — от бизнес-стратегии до тем для публикаций в блогах.
Несмотря на еще не полное совершенство, даже в нынешнем виде ChatGPT представляет ощутимую угрозу для Google, и руководство компании было вынуждено объявить «красный код» (внутренняя неформальная система оповещения сотрудников, в которой существует также «желтый код», который означает, что «можно идти домой, но ситуация серьезная»). У ИТ-гиганта есть и собственная альтернатива — система LaMDA, которая привлекла к себе внимание, когда один из инженеров компании провозгласил, что она обрела сознание. Это пока еще далеко от истины, но ситуация демонстрирует, насколько чат-боты продвинулись за последние месяцы. При этом альтернативой поисковой машины Google ее сделать не сможет — LaMDA не подходит для размещения рекламы, приносящей компании более 80% доходов.