Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Сети финансовой поддержки: как люди выручают друг друга в условиях кризиса Сети финансовой поддержки: как люди выручают друг друга в условиях кризиса

Как работает неформальная экономика во времена нестабильности

Forbes
По суше, по морю, по льду: как древние люди стремились попасть в Америку и не погибнуть по пути По суше, по морю, по льду: как древние люди стремились попасть в Америку и не погибнуть по пути

В доисторические времена путешествие в Америку сулило множество опасностей

Вокруг света
Авторство жизни: как предпринимателю выйти из тоннеля и найти для себя новый смысл Авторство жизни: как предпринимателю выйти из тоннеля и найти для себя новый смысл

Как предпринимателям найти себя в новом мире: на что надеяться и что делать?

Forbes
Ла‑ла-вуд Ла‑ла-вуд

Как «Вавилон» Дэмиена Шазелла фальсифицирует голливудский миф

Weekend
Porsche Cayenne первого поколения – отличный выбор для бездорожья Porsche Cayenne первого поколения – отличный выбор для бездорожья

Porsche Cayenne – отличный внедорожник для всех

4x4 Club
Умная стрижка: как авторская технология облегчила девушкам жизнь Умная стрижка: как авторская технология облегчила девушкам жизнь

Что такое «умная стрижка»?

VOICE
«Метамышление» «Метамышление»

Как нейронауки помогают нам понять себя

N+1
Дважды король Румынии Дважды король Румынии

Как Михай дважды побывал королём Румынии

Дилетант
Стали известны новые пугающие подробности того, как токсичные соединения PFAS влияют на иммунную систему человека Стали известны новые пугающие подробности того, как токсичные соединения PFAS влияют на иммунную систему человека

Некоторые типы PFAS могут нарушать жизненно важные функции иммунных клеток

ТехИнсайдер
Серьезное упущение: что такое неглект и как его распознать Серьезное упущение: что такое неглект и как его распознать

Может ли невнимательность и нечуткость превратиться в инструмент насилия

Forbes
Как по звуку определить, что сломалось в автомобиле Как по звуку определить, что сломалось в автомобиле

Пройдемся по звукам, с помощью которых техника жалуется на недомогания

Maxim
Было или небула: как устроены туманности Было или небула: как устроены туманности

Учимся отличать Конскую Голову от Столпов Творения

Maxim
После реставрационных работ Willys Jeep покрылся ржавчиной После реставрационных работ Willys Jeep покрылся ржавчиной

Старый ржавый Willys Jeep 1963 года

4x4 Club
Из чего сделана японская «мумия-русалка»? Жутковатую находку исследовали ученые Из чего сделана японская «мумия-русалка»? Жутковатую находку исследовали ученые

Оказалось, что «мумия-русалка» — искусственно созданный объект

Вокруг света
Как правильно собирать чемодан: лайфхаки, которые помогут компактно упаковать вещи Как правильно собирать чемодан: лайфхаки, которые помогут компактно упаковать вещи

Как компактно собрать чемодан, чтобы в него поместилось все необходимое

ТехИнсайдер
Как в V веке пытались предотвратить восстание мертвецов? История «вампира из Луньяно» и других детей Как в V веке пытались предотвратить восстание мертвецов? История «вампира из Луньяно» и других детей

Как люди поздней Античности сражались со сверхъестественными силами

Вокруг света
Как пережить смерть родителей в любом возрасте: 5 шагов, чтобы помочь себе, — советы психиатра Как пережить смерть родителей в любом возрасте: 5 шагов, чтобы помочь себе, — советы психиатра

Сколько бы лет нам ни было, смерть отца или матери всегда причиняет сильную боль

Psychologies
Идеальный бюджетный шторм Идеальный бюджетный шторм

Паника из-за январского дефицита бюджета неуместна

Эксперт
Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество

Где искать планеты, намного больше подходящие для жизни, чем Земля?

ТехИнсайдер
Поговори мне тут: как происходит революция в мире ИИ Поговори мне тут: как происходит революция в мире ИИ

Почему нейросети стали походить на людей?

РБК
Люди превратили самолеты в обычные дома! Посмотрите на «крылатую жизнь» Люди превратили самолеты в обычные дома! Посмотрите на «крылатую жизнь»

Джо Энн Ассери пришла в голову странная идея: жить в самолете

ТехИнсайдер
Подростковая агрессия. В чем причина и как научиться с ней справляться Подростковая агрессия. В чем причина и как научиться с ней справляться

Как помочь ребенку научиться справляться с агрессией

СНОБ
Почему люди покупают социальное? | Why people buy social things? Почему люди покупают социальное? | Why people buy social things?

Психология потребительского выбора

Позитивные изменения
Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес

Против этой триггерной еды не устоит и самая прокачанная сила воли

VOICE
Диплом за сутки. Разрушит ли чат-бот СhatGPT систему образования Диплом за сутки. Разрушит ли чат-бот СhatGPT систему образования

Для чего создавали чат-бот СhatGPT и как он повлиял на систему образования?

СНОБ
Россия — страна позитивных изменений | Russia — the Country of Positive Changes Россия — страна позитивных изменений | Russia — the Country of Positive Changes

Авторская статья Алексея Рыжкова — основателя Фабрики позитивных изменений

Позитивные изменения
Десять историй, как «валят» айтишников на технических интервью Десять историй, как «валят» айтишников на технических интервью

10 историй о том, как айтишники сталкивались с «душнилами» на интервью

VC.RU
7 предметов одежды, в которых категорически не рекомендуется спать 7 предметов одежды, в которых категорически не рекомендуется спать

Качество сна зависит не только от окружающей среды, мягкости постели и здоровья

ТехИнсайдер
«Мы поплакали мужскими слезами»: Стас Бондаренко рассказал о реакции сына на развод родителей «Мы поплакали мужскими слезами»: Стас Бондаренко рассказал о реакции сына на развод родителей

Стас Бондаренко поделился откровениями о крахе первого брака

VOICE
Записки отельера: бабушка уходит в отрыв Записки отельера: бабушка уходит в отрыв

Историю пожилой гостьи, которая решила кутить наполную

Правила жизни
Открыть в приложении