Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Большие языковые модели (LLM, Large Language Models)

Какие модели существуют уже сейчас

Рекомендуемые статьи

О том, почему профессия папарацци все еще жива и востребована

Александр Жадан — о том, как прославился благодаря ChatGPT

Что нового узнали зумеры об экономии и к чему ведут их потребительские привычки

Что будет, если выпить кофе перед сном?

Почему возникает скрип тормозов и когда он действительно требует внимания

Что делать, если свекровь — настоящий манипулятор?

Рукотворные звезды грозят сильно осложнить исследование Вселенной

Как устроен быт людей, которые живут в «сквотах»?

Образ загадочных «антиподов» продолжает будоражить воображение

Чем болезненно увлечены люди и что нам всем с этим делать

Почему важно уметь прощать и как этому научиться в любом возрасте

Супруга Валентина Юдашкина обнародовала нежные кадры с избранником

На противоположной стороне планеты живут 45 человек и птица уэка

Отрывок из романа Трейси Добмайер и Венди Кацман «Девочки с блестящим будущим»

Не только кофе: напитки, которые помогут вам проснуться

О феномене церемонии «Сделано в России» размышляет Сергей Николаевич

Иерихонский череп обрел новое лицо благодаря новейшим методам реконструкции

Рассказ, в котором персонажем становится музыка

Евгения Добровольская о своей героине, а также о роли в новом фильме

Что делать, если бабушка заболела болезнью Альцгеймера?

Как «Чебурашке» удалось стать самым кассовым фильмом российского проката

Как продержаться на гречке 2 недели без голода и сколько можно сбросить

Что имели в виду наши «прапра», когда говорили: «Красивый парень!»

Хакеры используют чат-бот ChatGPT для быстрого создания инструментов взлома

Как во всем преуспевать и всем нравиться?

Как быть, если ребенок не признает авторитета родителей и учителей

Меняется городская среда — меняются целые сценарии жизни горожан

Автобан: как появились эти дороги и почему на них нет ограничений скорости

Принц Гарри заверил, что болезненно переживает разрыв с венценосным отцом

Людей хоронили в болотах около 7000 лет