Как нейросети проваливаются в «долину разочарования» и почему это хорошо

Валерий Ковальский

Фото Nikolas Kokovlis / NurPhoto / Reuters

С момента появления ChatGPT прошло полтора года, и, преодолев все стадии от скепсиса до восторга, бизнес столкнулся с непониманием: как использовать LLM (Large Language Models, большие языковые модели) в своих процессах и какой реальный бизнес-эффект они дают? Постепенно рынок осознает, что внедрение генеративного ИИ требует дополнительных инвестиций — как в компетенции, так и в ресурсы — и двигается осторожно, соизмеряя возможную выгоду с рисками. О том, когда большие языковые модели займут уверенную позицию и достигнут пика своих мощностей, рассуждает Валерий Ковальский, СЕО AI-лаборатории Neuraldeep.tech (входит в группу компаний red_mad_robot).

Экосистема LLM в России

Для начала определимся с терминологией. Многие ошибочно используют термины GenAI (генеративный ИИ) и LLM как синонимы, но между ними есть принципиальная разница.

GenAI уместно использовать, когда обсуждается общая концепция искусственного интеллекта, способного создавать новые данные — текст, изображение, музыку и т.д., сам термин возник еще в середине 2010-х. LLM мы применяем, когда говорим о конкретных моделях машинного обучения, способных обрабатывать и генерировать естественный язык на основе огромных объемов данных, например: ChatGPT от OpenAI, Gemini от Google, YandexGPT от «Яндекса».

Российский рынок LLM находится в стадии активного развития, двигаясь в двух ключевых направлениях: научном и бизнесовом. Научные исследования в основном ориентированы на адаптацию зарубежных технологических достижений, однако силами энтузиастов в России тоже создаются свои наработки: например, ребята из МГУ создали и обучили токенайзер, который ускорил работу моделей на русском языке на 60%.

Бизнес-аспект, в свою очередь, делится на тех, кто создает LLM и всю необходимую инфраструктуру, и тех, кто создает сервисы вокруг этих LLM. В первой группе находятся всем известные бигтехи: «Яндекс» с YandexGPT и «Сбер» со своим GigaChat. Эти модели рассчитаны на максимально широкий круг людей. По понятным причинам игроков на этом поле пока не может быть много: создание и обучение собственных языковых моделей требует колоссальных затрат и очень квалифицированной команды. При этом, по данным наших внутренних тестирований, мощности российских LLM сильно уступают зарубежным и составляют в среднем около половины от качества генерации последних. Однако при выполнении задач на кириллице российские LLM показывают себя лучше ChatGPT версии 3.5.

Во второй «лиге» малые компании и стартапы, которые создают автоматизированные сервисы на базе больших языковых моделей. Так называемые ИИ-агенты, которые фокусируются на решении конкретных бизнес задач. По сути это та же LLM, только кастомизированная под конкретную компанию. Одной из главных проблем, с которыми сталкиваются малые игроки на рынке — ограниченный доступ к ресурсам, необходимым для сбора и разметки данных, обучения и поддержки языковых моделей.