Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

13 фактов о роме: невероятные порции, сельскохозяйственный ром и даже ром в СССР 13 фактов о роме: невероятные порции, сельскохозяйственный ром и даже ром в СССР

Казалось бы, где мы и где ром?

Maxim
Любовь пространства Любовь пространства

Янина Болдырева: медиум как метафора

Weekend
Самые дурацкие афродизиаки в истории человечества Самые дурацкие афродизиаки в истории человечества

Дуриан, картошка, яд жабы и другие странные афродизиаки

Maxim
Лига чемпионов Лига чемпионов

Способны ли российские компании восполнить дефицит технологий?

Robb Report
Равнение на «Знамя» Равнение на «Знамя»

Hongqi E HS9 стал чуть ли не первым представителем тяжелого автомобильного люкса

Автопилот
Мы идем по Африке: как бывший врач стал организатором охотничьих сафари в ЮАР Мы идем по Африке: как бывший врач стал организатором охотничьих сафари в ЮАР

Бывший врач Георгий Рагозин строит бизнес исходя из своих увлечений

Forbes
Лесные соседи Лесные соседи

Едва только март начинает прогревать поля, как в воздухе начинаются брожения

Наука и жизнь
Прически на короткие волосы: 7 вариантов на каждый день Прически на короткие волосы: 7 вариантов на каждый день

Многие думают, что короткая стрижка — это скучно. Мы с этим не согласны!

РБК
Деньги назад Деньги назад

Кто, как и сколько может сэкономить на налоговых вычетах

Деньги
«Мой ребенок прекрасен!»: 82-летний Роберто Кавалли стал отцом в шестой раз «Мой ребенок прекрасен!»: 82-летний Роберто Кавалли стал отцом в шестой раз

Бывшая шведская модель Playboy сделала Роберто Кавалли отцом в шестой раз

VOICE
На льду Байкала установили рекорд скорости На льду Байкала установили рекорд скорости

Какую скорость может развить электрокроссовер VOYAH FREE

Maxim
«Женщина в Азии себе не принадлежит»: как девочек воспитывают согласно традициям «Женщина в Азии себе не принадлежит»: как девочек воспитывают согласно традициям

Екатерина Манойло — о том, как семейное насилие лишает будущего

Forbes
Третья смена и «поколение сэндвич»: почему женщины трудятся больше остальных Третья смена и «поколение сэндвич»: почему женщины трудятся больше остальных

Сколько бы женщины могли зарабатывать, если бы не трудились бесплатно?

Forbes
Почему возраст теперь не принято отрицать и при чем здесь Голливуд Почему возраст теперь не принято отрицать и при чем здесь Голливуд

Как индустрии моды, красоты и мир кино меняют свое отношение к возрасту

РБК
Боль так сладка!.. Как современные авторы описывают абьюз: разбор с примерами Боль так сладка!.. Как современные авторы описывают абьюз: разбор с примерами

Психолог рассказывает про абьюз в современной литературе

Psychologies
Кусочки пластика разрушают пищеварительную систему морских птиц Кусочки пластика разрушают пищеварительную систему морских птиц

Ученые описали новое заболевание морских птиц. Они назвали его «пластикоз»

ТехИнсайдер
Французская кошка Французская кошка

Актриса Валери Зоидова говорит, что раскрывать женские характеры интересно

OK!
Александр Сокуров: «Власть не от Бога» Александр Сокуров: «Власть не от Бога»

Фильм «Молох» — не о Гитлере и не о немецком нацизме

Дилетант
Соперники «Весты». Машины дешевле ₽2 млн, которые уже можно купить Соперники «Весты». Машины дешевле ₽2 млн, которые уже можно купить

В России встречаются новые автомобили, готовые составить конкуренцию «Весте»

РБК
Ипотека от нуля Ипотека от нуля

Как и почему ЦБ борется с нулевыми процентами по ипотеке

Деньги
«Потанцуйте со мной»: каким получился байопик о Уитни Хьюстон «Потанцуйте со мной»: каким получился байопик о Уитни Хьюстон

Почему кино Кейси Леммонс теряется на фоне музыкальных байопиков последних лет

Forbes
Какую воду лучше пить: с газом или без? Какую воду лучше пить: с газом или без?

Что произойдёт с организмом, если обычную воду полностью заменить газированной?

ТехИнсайдер
Со льдом, но без газа Со льдом, но без газа

Неплохой способ заявить о новом авто: установить на нем сразу несколько рекордов

Автопилот
Что возраст говорит о нас и что говорим о нем мы Что возраст говорит о нас и что говорим о нем мы

Какую роль играет культура и общество в восприятии возраста?

РБК
Звериный оскал капитализма Звериный оскал капитализма

Лихие девяностые в карикатурах журнала «Крокодил»

Автопилот
Что делать, если AirPods не подключаются к устройству: инструкция Что делать, если AirPods не подключаются к устройству: инструкция

Что делать, если не получается подключить беспроводные наушники от Apple

ТехИнсайдер
Декларация независимости. История появления скоростных внедорожников Декларация независимости. История появления скоростных внедорожников

Как появились скоростные внедорожники

4x4 Club
Йога помогла девушке справиться с опытом изнасилования. Трагичная история Йога помогла девушке справиться с опытом изнасилования. Трагичная история

Девушка нашла необычный способ для преодоления травматичного опыта

ТехИнсайдер
Физика в НИИ Черногорье Физика в НИИ Черногорье

Большой и подробный разбор досок из Black Mesa — ремейка оригинального Half-Life

N+1
Тест-драйв кроссовера-фастбэка Omoda C5 4WD Тест-драйв кроссовера-фастбэка Omoda C5 4WD

Чем интересна улучшенная модификация Omoda C5 4WD

СНОБ
Открыть в приложении