Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Первым делом — самолеты: как женщины строят карьеру в гражданской авиации Первым делом — самолеты: как женщины строят карьеру в гражданской авиации

С какими стереотипами вынуждены ежедневно бороться женщины-пилоты?

Forbes
Как сохранить нервы и не перегореть на работе? Стоит узнать! Как сохранить нервы и не перегореть на работе? Стоит узнать!

Как сохранить свое ментальное здоровье на работе?

ТехИнсайдер
Скрытые подтексты: зачем инвестировать в искусство? Скрытые подтексты: зачем инвестировать в искусство?

Почему предметы искусства — перспективный объект для вложения капитала

Inc.
Едем в Геленджик! Едем в Геленджик!

Отправляемся на экскурсию по Геленджику с опытным гидом

Лиза
Два месяца под землей без света и общения с людьми: эксперимент Мишеля Сифра Два месяца под землей без света и общения с людьми: эксперимент Мишеля Сифра

Как проходил эксперимент Мишеля Сифра и к каким он пришел выводам

ТехИнсайдер
История обручального кольца Мэрилин Монро — самого загадочного украшения Голливуда История обручального кольца Мэрилин Монро — самого загадочного украшения Голливуда

Благодаря ей все девушки запомнили, что их лучшие друзья — бриллианты

Правила жизни
Проснуться счастливым: почему полезно начинать день с улыбки Проснуться счастливым: почему полезно начинать день с улыбки

Есть веские причины сменить хмурое выражение лица на улыбку

Правила жизни
«Хвалите компанию много и выучите всё, что о ней нашли»: как выдержать первую встречу с рекрутером «Хвалите компанию много и выучите всё, что о ней нашли»: как выдержать первую встречу с рекрутером

Об опыте прохождения первого собеседования в ИТ

VC.RU
Как искусственный интеллект ищет в космосе сигналы иных цивилизаций и что ему уже удалось обнаружить Как искусственный интеллект ищет в космосе сигналы иных цивилизаций и что ему уже удалось обнаружить

Ученые научили машинный алгоритм искать следы внеземных цивилизаций

ТехИнсайдер
«Мне все равно»: 3 фразы, которые нельзя говорить партнеру, — мнение психоаналитика «Мне все равно»: 3 фразы, которые нельзя говорить партнеру, — мнение психоаналитика

Некоторые фразы могут быть не так безобидны, как кажется

Psychologies
Электрический ток, вареные яйца аллигатора и заговоры: как раньше мужчины повышали потенцию Электрический ток, вареные яйца аллигатора и заговоры: как раньше мужчины повышали потенцию

Мужчинам с пониженным либидо приходилось искать разные методы решения проблемы

ТехИнсайдер
Людмила Целиковская: «Мне надоело бегать по рынкам, магазинам и зарабатывать деньги. Хочу раз в году ничего не делать» Людмила Целиковская: «Мне надоело бегать по рынкам, магазинам и зарабатывать деньги. Хочу раз в году ничего не делать»

Личная переписка легендарной актрисы Людмилы Целиковской

Коллекция. Караван историй
Отпустите меня! Отпустите меня!

Что делать, когда партнер хочет провести отдельно выходные или отпуск?

Добрые советы
Невербальное общение: как научиться понимать, что скрывается за словами собеседника Невербальное общение: как научиться понимать, что скрывается за словами собеседника

Как с помощью невербальных сигналов выстроить качественные отношения

Psychologies
«Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику «Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику

Ученая Нина Демме осталась в истории первой профессиональной полярницей

Forbes
Ла‑ла-вуд Ла‑ла-вуд

Как «Вавилон» Дэмиена Шазелла фальсифицирует голливудский миф

Weekend
Золотой запас: эти продукты лучше покупать замороженными и всегда держать в холодильнике Золотой запас: эти продукты лучше покупать замороженными и всегда держать в холодильнике

Кое-что гораздо надежнее сразу покупать в заморозке и всегда держать про запас

VOICE
Прикладная нумизматика: как найти редкую и дорогую монету Прикладная нумизматика: как найти редкую и дорогую монету

У каждого в кошельке есть дорогая монета. Просто нужно знать, что искать!

Maxim
5 увлекательных фэнтези-романов, основанных на реальных событиях 5 увлекательных фэнтези-романов, основанных на реальных событиях

Фэнтезийные романы, вдохновленные земной историей

Maxim
«Сын», которого не спас Хью Джекман: почему не удалась драма режиссера Зеллера «Сын», которого не спас Хью Джекман: почему не удалась драма режиссера Зеллера

Почему Зеллеру не удалось повторить успех предыдущего фильма

Forbes
Дженнифер Лопес. Путь наверх Дженнифер Лопес. Путь наверх

Женщина-звезда, певица, актриса, продюсер, бизнесвумен становится все интереснее

Караван историй
«Со временем карты краснеют»: сейсмолог Рубен Татевосян о последствиях землетрясений «Со временем карты краснеют»: сейсмолог Рубен Татевосян о последствиях землетрясений

Правильная оценка сейсмической опасности может помочь предотвратить разрушения

Forbes
4 важных детали в 5 серии «Одни из нас», которые ты, скорее всего, пропустил 4 важных детали в 5 серии «Одни из нас», которые ты, скорее всего, пропустил

Такие мелочи в сериале «Одни из нас» мог заметить только фанат оригинальной игры

Maxim
Личная история о генетике: отрывок из книги лауреата Пулитцера Личная история о генетике: отрывок из книги лауреата Пулитцера

Отрывок из первой главы книги «Ген. Очень личная история»

СНОБ
Команда Команда

Ушедший год для молодых артистов выдался более чем насыщенным

OK!
Биполярное расстройство: из крайности в крайность Биполярное расстройство: из крайности в крайность

Насколько серьезно биполярное расстройство и чем оно опасно для человека?

ТехИнсайдер
Вдова Владислава Стржельчика: «В театре его без иронии называли Ваше превосходительство» Вдова Владислава Стржельчика: «В театре его без иронии называли Ваше превосходительство»

Известного артиста Владислава Стржельчика обожали театралы и зрители кино

Коллекция. Караван историй
Эти продукты помогут вам укрепить иммунитет! Включите их в свой рацион уже сейчас Эти продукты помогут вам укрепить иммунитет! Включите их в свой рацион уже сейчас

Продукты, которые обеспечат организм ключевыми питательными веществами

ТехИнсайдер
Свобода в отношениях: каковы ее границы Свобода в отношениях: каковы ее границы

Только ли в одиночестве можно быть по-настоящему свободным?

Psychologies
Методика Outcome Mapping | Outcome Mapping, or Creating a map of behavioral changes Методика Outcome Mapping | Outcome Mapping, or Creating a map of behavioral changes

Создание карт поведенческих изменений

Позитивные изменения
Открыть в приложении