Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Закат культуры. Часть 2 Закат культуры. Часть 2

Жизнь в нищете и смерть в роскоши

Esquire
Сколько цветов принято дарить девушке и как сделать это правильно Сколько цветов принято дарить девушке и как сделать это правильно

Изучаем нормы цветочного этикета

Maxim
2010-е: архивация 2010-е: архивация

Знаковые вещи, определившие облик эпохи 2010–2020 годов, уходят со сцены

Maxim
Последние из рода Гитлера. В 21 веке человечество останется без потомков диктатора Последние из рода Гитлера. В 21 веке человечество останется без потомков диктатора

Все родственники Гитлера живут под другими именами

ТехИнсайдер
Смотреть подано: 10 крутых фильмов 2019 года, которые стоит пересмотреть Смотреть подано: 10 крутых фильмов 2019 года, которые стоит пересмотреть

Подборка хороших фильмов 2019 года

ТехИнсайдер
Овцеводство поддержат по-новому Овцеводство поддержат по-новому

Новая программа овцеводства должна учесть специфику развития отрасли

Агроинвестор
Суверенитет против общества: бывают ли «хорошие» законы об иностранных агентах Суверенитет против общества: бывают ли «хорошие» законы об иностранных агентах

Существует ли некое «хорошее» законодательство об иноагентах?

Forbes
Путь Хирохито: почему император Японии избежал трибунала после Второй мировой войны Путь Хирохито: почему император Японии избежал трибунала после Второй мировой войны

Как император Хирохито начал войну, а после нее стал символом демократизации

Forbes
Между нами, женщинами Между нами, женщинами

Эндометриоз: стоит ли переживать и можно ли избавиться от него навсегда

Лиза
Коллагеновая ампула. Как индустрия красоты разрушает экосистему лесов Амазонии Коллагеновая ампула. Как индустрия красоты разрушает экосистему лесов Амазонии

Как индустрия красоты влияет на экологию?

СНОБ
Насморк, прощай Насморк, прощай

Насморк – это не самостоятельная болезнь, а симптом различных заболеваний

Лиза
Вторые на Луне Вторые на Луне

Как продвигается работа над космической программой Artemis?

ТехИнсайдер
Почему финансовые маневры Binance до боли напоминают последние махинации FTX Почему финансовые маневры Binance до боли напоминают последние махинации FTX

Придумывать правила на рынке крупнейшей в мире криптобирже легче на ходу

Forbes
От Рубенса до «героиного шика»: блогер показывает идеалы красоты прошлых веков на собственном теле От Рубенса до «героиного шика»: блогер показывает идеалы красоты прошлых веков на собственном теле

Фитнес-блогер из Америки показывает, как изменчивы и иллюзорны идеалы красоты

VOICE
«Как обследовать росомаху» «Как обследовать росомаху»

Истории из ветеринарной практики

N+1
Невидимая Дженис: история женщины, которая коллекционирует чужие судьбы и меняет свою Невидимая Дженис: история женщины, которая коллекционирует чужие судьбы и меняет свою

Отрывок из дебютного романа Салли Пейдж «Хранительница историй»

Forbes
Три города-курорта России, куда лето приходит раньше календаря Три города-курорта России, куда лето приходит раньше календаря

Заждались лета? Добро пожаловать в Крым и на Кубань

Караван историй
«Дейзи Джонс и The Six»: красивая мелодрама о вымышленной рок-группе в стиле 1970-х «Дейзи Джонс и The Six»: красивая мелодрама о вымышленной рок-группе в стиле 1970-х

Сериал «Дейзи Джонс и The Six» — аутентичная история о любви и саморазрушении

Forbes
Светлые, добрые, легкие: 13 книг, которые помогут обрести веру в людей Светлые, добрые, легкие: 13 книг, которые помогут обрести веру в людей

Делимся необычной подборкой светлых книг для восстановления человечности

Psychologies
Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм Какие продукты можно есть после пищевого отравления: часы, дни, недели — восстановите организм

Что делать, если вы уже отравились?

Psychologies
Интервью Интервью

Али Онгер и Алексей Горский: почему сейчас самое время покупать яхту в Турции

Y Magazine
Юрий Насонов Юрий Насонов

Как Юрий Насонов бронирует за собой титул «реального пацана»

Собака.ru
Взлёты и падения. Особенности создания чешского внедорожника Взлёты и падения. Особенности создания чешского внедорожника

В этот раз мы поговорим о создании внедорожника ŠKODA

4x4 Club
Почему люди проваливаются под лёд: самые страшные недавние трагедии на замерзших реках Почему люди проваливаются под лёд: самые страшные недавние трагедии на замерзших реках

Почему люди выходят на лед, если знают, что это очень опасно?

VOICE
Постоянно проверяете соцсети и мессенджеры? Вероятно, у вас синдром FOMO Постоянно проверяете соцсети и мессенджеры? Вероятно, у вас синдром FOMO

Синдром упущенной выгоды испытывает более 80% жителей крупных городов

Psychologies
Немцы сделали порошковое пиво со всеми пивными компонентами Немцы сделали порошковое пиво со всеми пивными компонентами

Правда ли, что порошковое пиво практически неотличимо от обычного?

Maxim
Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов

Искусство средневековых художников не отличалось реалистичностью изображения

ТехИнсайдер
Не верю: почему уровень религиозности снижается во всем мире и в России Не верю: почему уровень религиозности снижается во всем мире и в России

Как религия связана с благополучием?

Forbes
Первая встреча Первая встреча

Если мы получим сигнал от братьев по разуму, то что будем делать дальше?

ТехИнсайдер
«Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика «Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика

Часто после расставания мы хотим слишком многого от будущего партнера

Psychologies
Открыть в приложении