Когда большие языковые модели займут уверенную позицию и достигнут пика?

ForbesHi-Tech

Как нейросети проваливаются в «долину разочарования» и почему это хорошо

Валерий Ковальский

Фото Nikolas Kokovlis / NurPhoto / Reuters

С момента появления ChatGPT прошло полтора года, и, преодолев все стадии от скепсиса до восторга, бизнес столкнулся с непониманием: как использовать LLM (Large Language Models, большие языковые модели) в своих процессах и какой реальный бизнес-эффект они дают? Постепенно рынок осознает, что внедрение генеративного ИИ требует дополнительных инвестиций — как в компетенции, так и в ресурсы — и двигается осторожно, соизмеряя возможную выгоду с рисками. О том, когда большие языковые модели займут уверенную позицию и достигнут пика своих мощностей, рассуждает Валерий Ковальский, СЕО AI-лаборатории Neuraldeep.tech (входит в группу компаний red_mad_robot).

Экосистема LLM в России

Для начала определимся с терминологией. Многие ошибочно используют термины GenAI (генеративный ИИ) и LLM как синонимы, но между ними есть принципиальная разница.

GenAI уместно использовать, когда обсуждается общая концепция искусственного интеллекта, способного создавать новые данные — текст, изображение, музыку и т.д., сам термин возник еще в середине 2010-х. LLM мы применяем, когда говорим о конкретных моделях машинного обучения, способных обрабатывать и генерировать естественный язык на основе огромных объемов данных, например: ChatGPT от OpenAI, Gemini от Google, YandexGPT от «Яндекса».

Российский рынок LLM находится в стадии активного развития, двигаясь в двух ключевых направлениях: научном и бизнесовом. Научные исследования в основном ориентированы на адаптацию зарубежных технологических достижений, однако силами энтузиастов в России тоже создаются свои наработки: например, ребята из МГУ создали и обучили токенайзер, который ускорил работу моделей на русском языке на 60%.

Бизнес-аспект, в свою очередь, делится на тех, кто создает LLM и всю необходимую инфраструктуру, и тех, кто создает сервисы вокруг этих LLM. В первой группе находятся всем известные бигтехи: «Яндекс» с YandexGPT и «Сбер» со своим GigaChat. Эти модели рассчитаны на максимально широкий круг людей. По понятным причинам игроков на этом поле пока не может быть много: создание и обучение собственных языковых моделей требует колоссальных затрат и очень квалифицированной команды. При этом, по данным наших внутренних тестирований, мощности российских LLM сильно уступают зарубежным и составляют в среднем около половины от качества генерации последних. Однако при выполнении задач на кириллице российские LLM показывают себя лучше ChatGPT версии 3.5.

Во второй «лиге» малые компании и стартапы, которые создают автоматизированные сервисы на базе больших языковых моделей. Так называемые ИИ-агенты, которые фокусируются на решении конкретных бизнес задач. По сути это та же LLM, только кастомизированная под конкретную компанию. Одной из главных проблем, с которыми сталкиваются малые игроки на рынке — ограниченный доступ к ресурсам, необходимым для сбора и разметки данных, обучения и поддержки языковых моделей.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Эпидемия «проявленности»: как искренность превратилась в коммерческий продукт Эпидемия «проявленности»: как искренность превратилась в коммерческий продукт

Как искренность превратилась в перформанс?

Forbes
Синдром Дон Жуана: какая детская травма скрыта за образом мачо Синдром Дон Жуана: какая детская травма скрыта за образом мачо

Что такое синдром Дон Жуана, как с ним живут мужчины?

Psychologies
Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты! Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдер
«Я люблю свою работу» «Я люблю свою работу»

Факторы корпоративного благополучия в НКО и гипотезы о роли оценки

Позитивные изменения
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Макак научили чувствовать ритм Макак научили чувствовать ритм

Обезьяны ритмично двигали рукой под музыку за вознаграждение

N+1
7 стратегий, чтобы пережить тяжелый день 7 стратегий, чтобы пережить тяжелый день

Техники поведения в трудной ситуации, которую нельзя изменить прямо сейчас

Psychologies
Умение держать себя в руках Умение держать себя в руках

Как научить ребенка контролировать свои хотелки и эмоции?

Здоровье
Жизнь без еды Жизнь без еды

Среди насекомых есть виды, которые во взрослом состоянии не питаются вовсе

Наука и жизнь
Метод шифрования будущего Метод шифрования будущего

Что такое постквантовая криптография и от каких киберугроз она сможет защитить

РБК
Своим путём Своим путём

Разработка российского Стандарта отчетности об устойчивом развитии

Позитивные изменения
Сейсмограф князя Голицына Сейсмограф князя Голицына

О вкладе Бориса Голицына в мировую науку — беседа с Георгием Голицыным

Знание – сила
Феномен де Клерка Феномен де Клерка

Фредерик Виллем де Клерк — последний белый президент ЮАР

Дилетант
Рентабельное яблоко полного цикла Рентабельное яблоко полного цикла

Компания «Брянский сад» построила первые ультрасовременного плодохранилища

Монокль
Каменные плитки из затопленного памятника эпох мезолита и неолита оказались функциональными орудиями Каменные плитки из затопленного памятника эпох мезолита и неолита оказались функциональными орудиями

Ученые исследовали 11 каменных плиток, обнаруженных на затопленном памятнике

N+1
Список на лето: 7 важных книг для подростков Список на лето: 7 важных книг для подростков

7 небанальных, но важных книг для людей 12–18 лет

СНОБ
Ремесло как искусство Ремесло как искусство

Вдохновляющий и наполненный фактурами интерьер студии керамики

SALON-Interior
Женский вопрос Женский вопрос

Фиброаденома молочной железы: современные способы лечения

Лиза
Сериал «Олененок»: почему история о сталкинге так затягивает Сериал «Олененок»: почему история о сталкинге так затягивает

Как и почему сериал о сталкинге «Олененок» завоевал так много поклонников

Psychologies
Что такое русский модерн? Что такое русский модерн?

Как русский модерн преломляется и выглядит в современных интерьерах наших дней?

Правила жизни
WD-40: история компании, которая создала универсальное средство WD-40: история компании, которая создала универсальное средство

Где и как была разработана формула «всемогущей» жидкости

ТехИнсайдер
7 фраз, которые нельзя говорить самому себе 7 фраз, которые нельзя говорить самому себе

Некоторые установки по-настоящему токсичны, и их лучше избегать

Maxim
Гид в кармане Гид в кармане

7 полезных приложений для путешествий по России

Лиза
«Место авиакатастрофы напоминало кадр из фильма»: трагедия 1997 года в Иркутске «Место авиакатастрофы напоминало кадр из фильма»: трагедия 1997 года в Иркутске

Крушение самолета Ан-124 «Руслан» 1997 года в Иркутске: как это было

ТехИнсайдер
Моника Вуд «Как читать книги». Глава из романа Моника Вуд «Как читать книги». Глава из романа

Добрый и трогательный роман о важности второго шанса «Как читать книги»

СНОБ
Зигзаг удачи Зигзаг удачи

Три личные и искренние истории поисков и открытий себя

Psychologies
10+ предметов, которые сделает ослепительно чистыми перекись водорода: советы клинеров 10+ предметов, которые сделает ослепительно чистыми перекись водорода: советы клинеров

Как использовать перекись водорода для очистки самых разных поверхностей

VOICE
Связывая микромир с громадной Вселенной Связывая микромир с громадной Вселенной

Дмитрий Горбунов о поиске других моделей эволюции Вселенной

Знание – сила
Миллион цветных деталей Миллион цветных деталей

Весь мир играет в конструкторы «Лего» семьдесят лет и не наигрался до сих пор

Вокруг света
«Это сейчас был сексизм»: как микрофеминизм помогает женщинам бороться за свои права «Это сейчас был сексизм»: как микрофеминизм помогает женщинам бороться за свои права

Что такое микрофеминизм, как он может помочь женщинам в борьбе за равенство?

Forbes
Открыть в приложении