«Криворукие гуманоиды», или Поговори со мной, машина!
Директор Центра прикладного искусственного интеллекта Сколтеха, руководитель научной группы AIRI Евгений Бурнаев рассказывает, мог ли чат GPT появиться в России, почему Китай скоро обгонит США и может ли ИИ разгадать загадки человеческого мозга.
Что было придумано такого в ChatGPT, чего не было до этого? Почему вдруг такой взрыв интереса?
— Как обычно, это сочетание нескольких факторов. Первый фактор — очень специальная архитектура нейросети, то есть, по сути, очень специальная конструкция вычислительного алгоритма. Используется так называемый механизм внимания — специальный класс алгоритмов, который позволяет оценивать, насколько сильно какие‑то слова в предложении зависят от контекста. Механизм внимания был известен уже давно, однако в процессе проведения экспериментов было замечено, что если использовать очень большие нейросети (с большим числом параметров), которые позволяют делать оценку внимания для текстов большого размера и настраивать параметры нейросетей по огромным выборкам данных, то в результате получаются модели, которые на качественно новом уровне могут извлекать смыслы из текстов. Это второй фактор. Конечно, при этом требуются значительные вычислительные мощности.
Сотрудники компании OpenAI, которые первыми заметили эту тенденцию, продолжили активно инвестировать в данное направление. Третье — был предложен и использован для обучения ChatGPT новый алгоритм с подкреплением на основе обратной связи от пользователя. Для этого требуются значительные средства для получения специальным образом подготовленной выборки данных в виде вопросов и ответов людей на них. В итоге модель ChatGPT на регулярной основе получала обратную связь от пользователей, что позволяло автоматически улучшать ее работу.
— Как это выглядело в реальности?
— Они наняли столько‑то сотен определенным образом подготовленных людей, сначала тренировали их, как правильно составлять вот эти пары вопросов‑ответов — определенные вопросы и детальные ответы на них. Более того, некоторые из ответов были развернутые, представленные в виде рассуждений.
— То есть логически?
— Эта цепочка рассуждений в конце приводит к ответу на поставленный вопрос. Все указанные факторы, описанные выше приемы оказались очень важными и полезными, кардинально повышающим качество, они позволили «дойти последнюю милю». Примерно так же было с системой распознавания лиц. Долгое время качество распознавания, условно, не превышало 85%. Вроде бы с формальной точки зрения точность в 85% выглядит неплохо, но этого совсем недостаточно для приложений.
На практике нужна точность гораздо больше 95%. Преодоление этой разницы требовало наиболее значительных усилий. Как только удалось это сделать за счет новых алгоритмов, сразу стало возможным строить системы распознавания, которые работали в разы лучше прежних, и их использование в различных бизнес‑приложениях стало экономически оправданным. Так и в случае языковых моделей. Языковые модели предыдущего поколения неплохо работали в каких‑то достаточно узких инженерных задачах. За счет сочетания факторов, которые я описал выше, удалось кардинально повысить качество и выйти на новый уровень понимания естественного языка.
Ненужные люди
— Все как раз прогнозируют какой‑то передел структуры рынка, замену ИИ большого количества специальностей, переживают инженеры, художники, журналисты.
— Это, конечно, больная тема, но на самом деле эти процессы, на мой взгляд, не слишком быстрые. Конечно, если речь идет о, например, стоковых рисунках для презентаций, то да, я согласен, генеративная модель может вместо художника такой рисунок легко сгенерировать. Но для результатов более высокого уровня пока еще требуется участие профессионала.
— OpenAI довольно неплохо привлекла к себе внимание, уволив и взяв обратно на работу Сэма Альтмана, который якобы хотел предупредить человечество о том, что ИИ достиг какого‑то опасного порога развития.
— Действительно, в прессе стали появляться сообщения, что фактически уже создан интеллект, который всех скоро поработит, займет рабочие места и т. д. Например, даже лауреат Нобелевской премии Кристофер Писсаридес посоветовал абитуриентам не стремиться изучать естественные науки, технические дисциплины и математику. Он считает, что в будущем будут гораздо выше цениться «эмпатические» и творческие навыки, которые помогут процветать в мире доминирования искусственного интеллекта. На мой взгляд такие советы — это, конечно, крайность.
Займет ли ИИ рабочие места? Конечно, займет! А потом создаст в два раза больше рабочих мест, чтобы разгрести все то, что ИИ же и наворотил, а точнее, «криворукие гуманоиды» с его помощью. Действительно, программный модуль на основе ИИ, вообще говоря, имеет ненулевую вероятность выдать ошибочный прогноз. Соответственно, такого рода модуль может, с одной стороны, повысить эффективность принятия решений, но с другой стороны требуется встраивать его в ИТ‐системы надлежащим образом, принимая во внимание эту особенность — что некоторые прогнозы, пусть даже и очень небольшая их часть, могут быть ошибочными. В случае если речь идет о какой‐то ИТ‐системе для управления критической инфраструктурой, появление таких ошибок может быть фатальным. Соответственно, очень важно наличие высококвалифицированных специалистов экспертов в ИИ, которые могут надлежащим образом оценить все риски и верифицировать решение на основе ИИ. Помимо этого, требуется вовлечение квалифицированных разработчиков со знанием основ ИИ, которые смогут правильным образом встроить модуль на основе ИИ в ИТ‑систему с учетом всех его особенностей.
— Зато вылезают какие‑то опасности, о которых мы раньше и не подозревали.
— Понятно, что искусственный интеллект можно встраивать в военные изделия. Но, опять‑таки, кажется, что это просто всего лишь еще одна дополнительная техническая возможность, которой раньше не было. Если мы уже начали говорить про технику, то сначала тракторов не было, потом они появились. Хорошая вещь? Конечно, стало проще выращивать пшеницу. Но трактора — это еще и танки. С ИИ примерно такая же история будет, в моем понимании. Стали появляться дипфейки — стали появляться и методы, и сервисы на их основе для выявления дипфейков.