Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Изменения к лучшему: каким получился обновленный кросс-купе Exeed RX Flagship Изменения к лучшему: каким получился обновленный кросс-купе Exeed RX Flagship

Чем кросс-купе Exeed RX Flagship отличается от своего «старшего брата»

Forbes
На тёмной стороне искусства На тёмной стороне искусства

На коллекционерах то и дело наживаются всякого рода жулики, мошенники и воры

Robb Report
Деньги за идею: как и зачем технологические компании выходят на pre-IPO Деньги за идею: как и зачем технологические компании выходят на pre-IPO

Сколько технологическим компаниям удается зарабатывать на pre-IPO

Forbes
Стечение обстоятельств: что не так с приговором Сергею Фургалу Стечение обстоятельств: что не так с приговором Сергею Фургалу

К хронологии действий следствия по делу Фургала есть серьезные вопросы

Forbes
4 японских принципа, которые спасут вас от тревоги 4 японских принципа, которые спасут вас от тревоги

Как думаете, что можно назвать лучшим лекарством от тревожности?

Psychologies
Насколько устарело наше будущее? | How Obsolete is Our Future? Насколько устарело наше будущее? | How Obsolete is Our Future?

Гипотезы об изменениях приоритетов муниципального управления

Позитивные изменения
Дарья Мороз: «Я человек собранный, но чувствительный и ранимый» Дарья Мороз: «Я человек собранный, но чувствительный и ранимый»

Актриса Дарья Мороз – о персонажах и откровенных сценах в кино

VOICE
8 самых страшных пятен от пищи и простые способы их удаления 8 самых страшных пятен от пищи и простые способы их удаления

Справиться со сложными пятнами по силам каждому! Изучите эти базовые правила

ТехИнсайдер
Когда пора обратиться к сексологу: 3 повода — проверьте вашу пару Когда пора обратиться к сексологу: 3 повода — проверьте вашу пару

Семейный психотерапевт называет три повода задуматься о визите к сексологу

Psychologies
Ставки эпохи возрождения Ставки эпохи возрождения

Что ожидает рынки акций после рекордных провалов

Деньги
Итальянский гангстер скрывался 16 лет в пиццериях Франции. Но его поймали! Итальянский гангстер скрывался 16 лет в пиццериях Франции. Но его поймали!

Интерпол наконец задержал знаменитого бандита из Италии

ТехИнсайдер
Человек с купюры Человек с купюры

История человека, памятник которому украшает купюру в 5000 рублей

Дилетант
Петербург Ивана Крылова: как Город на Неве отметил свой столетний юбилей и пережил череду невзгод Петербург Ивана Крылова: как Город на Неве отметил свой столетний юбилей и пережил череду невзгод

Торжества, устроенные Александром I, надолго запомнились петербуржцам

Вокруг света
Кто-то зовет в снежной степи: чем привлекает бурятское современное искусство Кто-то зовет в снежной степи: чем привлекает бурятское современное искусство

Мифические существа и нежные натюрморты: работы художницы Аллы Цыбиковой

Forbes
История символов знаков зодиака История символов знаков зодиака

Неочевидные смыслы и зашифрованные послания знаков зодиака

Лиза
Секс-монстра наказали: признавшийся в 24 изнасилованиях полицейский получил 36 пожизненных сроков Секс-монстра наказали: признавшийся в 24 изнасилованиях полицейский получил 36 пожизненных сроков

Дэвид Кэррик признан виновным в насилии над женщинами

VOICE
Что жизнь на Марсе может сделать с человеческим телом: почему идея Илона Маска покорить Красную планету неразумна Что жизнь на Марсе может сделать с человеческим телом: почему идея Илона Маска покорить Красную планету неразумна

Почему люди еще не готовы к покорению Красной планеты

ТехИнсайдер
То, как вы держите руль, может многое рассказать о вашей личности: простой психологический тест с неожиданными выводами То, как вы держите руль, может многое рассказать о вашей личности: простой психологический тест с неожиданными выводами

Вспомните, как вы привыкли водить, и узнайте несколько интересных фактов о себе

ТехИнсайдер
Пять cамых громких терактов, за которые никто не взял ответственность Пять cамых громких терактов, за которые никто не взял ответственность

Последние четверть века теракты все чаще совершают анонимные группы

Maxim
Королева Twitch: как 20-летняя москвичка прославилась на стримах под укулеле Королева Twitch: как 20-летняя москвичка прославилась на стримах под укулеле

Как Мирзоева стала одной из самых популярных в России стримерш?

Forbes
Алгоритм создает для НАСА невероятные Алгоритм создает для НАСА невероятные

НАСА создает более легкие и прочные детали для будущих космических кораблей

ТехИнсайдер
«Давай разведемся»: 5 случаев, когда брак лучше не сохранять «Давай разведемся»: 5 случаев, когда брак лучше не сохранять

Как понять, что вам пора подавать на развод?

Psychologies
Неандертальцы охотились на 13-тонных прямобивневых слонов Неандертальцы охотились на 13-тонных прямобивневых слонов

Неандертальцы, жившие 125 тысяч лет назад, охотились на прямобивневых слонов

N+1
На его стороне На его стороне

Как приободрить и утешить того, кто отказывается от любой помощи?

Лиза
Пятый в истории: что означает новый случай излечения от ВИЧ Пятый в истории: что означает новый случай излечения от ВИЧ

Победить ВИЧ удалось после трансплантации пациенту стволовых клеток

Forbes
Кто такая «кузькина мать» и еще 6 крылатых выражений, историю которых мы безвозвратно забыли Кто такая «кузькина мать» и еще 6 крылатых выражений, историю которых мы безвозвратно забыли

Вспоминаем историю популярных крылатых выражений

Вокруг света
Дороже жизни. Почему современные подростки привязаны к своим смартфонам Дороже жизни. Почему современные подростки привязаны к своим смартфонам

Какую роль в жизни подростков играет вопрос престижа

СНОБ
Танцуем и худеем Танцуем и худеем

8 самых эффективных тренировок, для которых нужна только музыка

Лиза
Как выгодно инвестировать в искусство — рассказывает руководитель аукционного дома ARTinvestment.Ru Егор Молчанов Как выгодно инвестировать в искусство — рассказывает руководитель аукционного дома ARTinvestment.Ru Егор Молчанов

Насколько сейчас выгодно инвестировать в арт-активы?

СНОБ
Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество Новые Земли: есть ли во Вселенной планеты, на которые может переселиться человечество

Где искать планеты, намного больше подходящие для жизни, чем Земля?

ТехИнсайдер
Открыть в приложении