Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как фотограф Рино Бариллари снимал Одри Хепберн, принцессу Диану и 12 раз ломал ребра Как фотограф Рино Бариллари снимал Одри Хепберн, принцессу Диану и 12 раз ломал ребра

О том, почему профессия папарацци все еще жива и востребована

Forbes
«Это ящик Пандоры, и его надо было открыть» «Это ящик Пандоры, и его надо было открыть»

Александр Жадан — о том, как прославился благодаря ChatGPT

Inc.
«Покажи свой бюджет»: к чему ведет молодежный тренд на публичную экономию «Покажи свой бюджет»: к чему ведет молодежный тренд на публичную экономию

Что нового узнали зумеры об экономии и к чему ведут их потребительские привычки

Forbes
Как кофеин влияет на сон Как кофеин влияет на сон

Что будет, если выпить кофе перед сном?

ТехИнсайдер
Почему скрипят тормоза у машины и что с этим делать Почему скрипят тормоза у машины и что с этим делать

Почему возникает скрип тормозов и когда он действительно требует внимания

РБК
«Вы совершенно правы, мамочка»: как отвечать свекрови — случай из практики психолога «Вы совершенно правы, мамочка»: как отвечать свекрови — случай из практики психолога

Что делать, если свекровь — настоящий манипулятор?

Psychologies
Небо в «Старлинках»: уживутся ли астрономы с созвездиями микроспутников Небо в «Старлинках»: уживутся ли астрономы с созвездиями микроспутников

Рукотворные звезды грозят сильно осложнить исследование Вселенной

Forbes
Как устроена нелегальная жизнь бедных людей в Лондоне. Интересные факты и фотографии Как устроена нелегальная жизнь бедных людей в Лондоне. Интересные факты и фотографии

Как устроен быт людей, которые живут в «сквотах»?

ТехИнсайдер
Марш антиподов Марш антиподов

Образ загадочных «антиподов» продолжает будоражить воображение

Вокруг света
Самые распространенные зависимости современного общества — хотя бы от одной из них страдаете и вы! Самые распространенные зависимости современного общества — хотя бы от одной из них страдаете и вы!

Чем болезненно увлечены люди и что нам всем с этим делать

ТехИнсайдер
Почему опасно копить обиды и как научиться прощать? Почему опасно копить обиды и как научиться прощать?

Почему важно уметь прощать и как этому научиться в любом возрасте

Правила жизни
«У нас юбилей! 35 лет вместе!»: жена Валентина Юдашкина показала редкое фото с ним в молодости «У нас юбилей! 35 лет вместе!»: жена Валентина Юдашкина показала редкое фото с ним в молодости

Супруга Валентина Юдашкина обнародовала нежные кадры с избранником

VOICE
Дальше ехать некуда Дальше ехать некуда

На противоположной стороне планеты живут 45 человек и птица уэка

Вокруг света
Трейси Добмайер и Венди Кацман: «Девочки с блестящим будущим». Цена поступления в престижный вуз Трейси Добмайер и Венди Кацман: «Девочки с блестящим будущим». Цена поступления в престижный вуз

Отрывок из романа Трейси Добмайер и Венди Кацман «Девочки с блестящим будущим»

СНОБ
Чем заменить кофе: 7 бодрящих и полезных напитков Чем заменить кофе: 7 бодрящих и полезных напитков

Не только кофе: напитки, которые помогут вам проснуться

ТехИнсайдер
Ностальгия по настоящему Ностальгия по настоящему

О феномене церемонии «Сделано в России» размышляет Сергей Николаевич

СНОБ
Как выглядел обладатель знаменитого Как выглядел обладатель знаменитого

Иерихонский череп обрел новое лицо благодаря новейшим методам реконструкции

ТехИнсайдер
Детство, музыка, поход: читаем новый рассказ Нины Дашевской «Молчание» Детство, музыка, поход: читаем новый рассказ Нины Дашевской «Молчание»

Рассказ, в котором персонажем становится музыка

Правила жизни
«Каждая женщина умеет мечтать» «Каждая женщина умеет мечтать»

Евгения Добровольская о своей героине, а также о роли в новом фильме

OK!
Путь бабушки Любы Путь бабушки Любы

Что делать, если бабушка заболела болезнью Альцгеймера?

СНОБ
Неизвестный науке зверь. Как «Чебурашке» удалось собрать больше 5 млрд руб. и стать самым кассовым фильмом в истории российского проката Неизвестный науке зверь. Как «Чебурашке» удалось собрать больше 5 млрд руб. и стать самым кассовым фильмом в истории российского проката

Как «Чебурашке» удалось стать самым кассовым фильмом российского проката

Inc.
Диета на гречке Диета на гречке

Как продержаться на гречке 2 недели без голода и сколько можно сбросить

Лиза
Никаких кубиков на животе: каких мужчин считали красивыми на Руси Никаких кубиков на животе: каких мужчин считали красивыми на Руси

Что имели в виду наши «прапра», когда говорили: «Красивый парень!»

VOICE
Как киберпреступники создают вредоносные программы при помощи чат-бота ChatGPT Как киберпреступники создают вредоносные программы при помощи чат-бота ChatGPT

Хакеры используют чат-бот ChatGPT для быстрого создания инструментов взлома

Forbes
Как принять свою неидеальность: 7 основных правил Как принять свою неидеальность: 7 основных правил

Как во всем преуспевать и всем нравиться?

Psychologies
Мы для них не авторитет: как общаться с современными детьми и подростками Мы для них не авторитет: как общаться с современными детьми и подростками

Как быть, если ребенок не признает авторитета родителей и учителей

СНОБ
Проектируем города будущего: основные принципы импакт-инвестиций | Designing the City of the Future: the Basic Principles of Impact Investment Проектируем города будущего: основные принципы импакт-инвестиций | Designing the City of the Future: the Basic Principles of Impact Investment

Меняется городская среда — меняются целые сценарии жизни горожан

Позитивные изменения
Дорогой дальнею, дорогой длинною... Краткая история немецких автобанов Дорогой дальнею, дорогой длинною... Краткая история немецких автобанов

Автобан: как появились эти дороги и почему на них нет ограничений скорости

4x4 Club
«Я хочу вернуть отца и брата. Но меня с женой выставляют злодеями»: принц Гарри сделал новые душещипательные признания «Я хочу вернуть отца и брата. Но меня с женой выставляют злодеями»: принц Гарри сделал новые душещипательные признания

Принц Гарри заверил, что болезненно переживает разрыв с венценосным отцом

VOICE
Болота были традиционным местом упокоения жителей Северной Европы на протяжении почти 7000 лет Болота были традиционным местом упокоения жителей Северной Европы на протяжении почти 7000 лет

Людей хоронили в болотах около 7000 лет

ТехИнсайдер
Открыть в приложении