Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Положительно заряженные: что заставляет человека оставаться оптимистом Положительно заряженные: что заставляет человека оставаться оптимистом

Ученые и философы отвечают на вопрос «Что вызывает у вас оптимизм?»

Esquire
Помощь недруга Помощь недруга

Как план Маршалла и отказ СССР от участия в нем привели к Холодной войне

Weekend
Олимпийская спортсменка сменила коньки на эротические фото: кто такая Александра Янкулеску и что она делает на OnlyFans Олимпийская спортсменка сменила коньки на эротические фото: кто такая Александра Янкулеску и что она делает на OnlyFans

Канадская рекордсменка румынского происхождения продает свои обнаженные фото

Maxim
Букет угроз: какие киберриски из 2022-го останутся актуальными в этом году Букет угроз: какие киберриски из 2022-го останутся актуальными в этом году

В киберпространстве нарастает напряжение

Forbes
Как стартапер и два инвестбанкира выручили 60 млн рублей на подборе витаминов Как стартапер и два инвестбанкира выручили 60 млн рублей на подборе витаминов

Как был запущен сервис индивидуального подбора витаминов Vitobox

Forbes
Отложенный успех: как Брендан Фрейзер вернулся в большое кино и выиграл «Оскар» Отложенный успех: как Брендан Фрейзер вернулся в большое кино и выиграл «Оскар»

Как Брендан Фрейзер вернулся в большое кино после более десятилетнего перерыва

Forbes
Давление повысилось: 6 фильмов с Педро Паскалем Давление повысилось: 6 фильмов с Педро Паскалем

Что стоит посмотреть, если и у вас из головы не выходит этот харизматик

Правила жизни
Сериал «Король и Шут»: почему панки — это про свободу, анархию и сказки Сериал «Король и Шут»: почему панки — это про свободу, анархию и сказки

Сериал «Король и шут» — самый успешный релиз в истории «Кинопоиска»

Forbes
Как IT-сервисы проходят путь от внутреннего инструмента до публичного решения Как IT-сервисы проходят путь от внутреннего инструмента до публичного решения

Как множество компаний создают внутренние инструменты для своих целей

Forbes
Оценка в настоящем и будущем: взгляд грантодающих организаций | The Present and the Future of Evaluation: The Donors’ View Оценка в настоящем и будущем: взгляд грантодающих организаций | The Present and the Future of Evaluation: The Donors’ View

Какие значимые изменения произошли в 2022 году в сфере оценки в целом?

Позитивные изменения
Вулканы, волны, вертолеты: чем заняться на Камчатке Вулканы, волны, вертолеты: чем заняться на Камчатке

Побывать на Камчатке хоть раз в жизни нужно каждому

РБК
Что такое искусственная кома и чем она отличается от обычной Что такое искусственная кома и чем она отличается от обычной

Зачем человека специально вводят в кому?

ТехИнсайдер
Неперерабатываемая пластика Неперерабатываемая пластика

Алексей Каллима: искусство мимикрии

Weekend
Несгибаемая Мишель Йео: как актриса боролась со стереотипами Голливуда и победила Несгибаемая Мишель Йео: как актриса боролась со стереотипами Голливуда и победила

Forbes Woman рассказывает о долгом пути Мишель Йео к признанию

Forbes
Почему рыбным днём считается именно четверг? Почему рыбным днём считается именно четверг?

Почему из всех семи дней в недели рыбным днем выбрали именно четверг?

ТехИнсайдер
Нитками вместо красок Нитками вместо красок

Журнал и картины Веры — нежные, чуть наивные, живые — соединились

Seasons of life
«Мешалка» или «Притворщик»: 4 типа токсичных друзей «Мешалка» или «Притворщик»: 4 типа токсичных друзей

А что, если среди ваших друзей тоже есть токсичные люди?

Psychologies
От «Спрута» к «Медузе» От «Спрута» к «Медузе»

«Тень Караваджо»: Микеле Плачидо размышляет о гении и свободе

Weekend
Я не боюсь: откуда берутся страхи и как с ними жить Я не боюсь: откуда берутся страхи и как с ними жить

Страх — это нормальное физиологическое чувство, пока оно не мешает нам жить

Правила жизни
Почему возраст теперь не принято отрицать и при чем здесь Голливуд Почему возраст теперь не принято отрицать и при чем здесь Голливуд

Как индустрии моды, красоты и мир кино меняют свое отношение к возрасту

РБК
Как сочинить ребенку сказку за пару минут: советы родителям Как сочинить ребенку сказку за пару минут: советы родителям

Глава из книги Литы Ли «Мам, расскажи сказку! Как сочинить сказку для ребенка»

Psychologies
Образ матери: как он влияет на дочь? Образ матери: как он влияет на дочь?

Как воспитывают детей разные типы матерей?

Psychologies
Монархист во главе республики Монархист во главе республики

Гинденбург и представить себе не мог, что превратится в общенациональный символ

Дилетант
Почему мы стареем и способна ли наука взломать этот процесс Почему мы стареем и способна ли наука взломать этот процесс

Может ли предельный средний возраст человека превышать 120 лет?

РБК
Быть в фокусе Быть в фокусе

6 первых признаков снижения зрения

Лиза
4 типа вещей, которые нельзя носить женщинам с животиком 4 типа вещей, которые нельзя носить женщинам с животиком

Какие вещи лучше отложить подальше, если хочешь замаскировать проблемные зоны

VOICE

Для некоторых планет столкновение со спутником может быть обыденным явлением

ТехИнсайдер
Бьюти-буллинг: кто заставляет женщин ненавидеть свою внешность Бьюти-буллинг: кто заставляет женщин ненавидеть свою внешность

В чем причины возникновения бьюти-буллинга?

Forbes
Как правильно подготовить смартфон к продаже Как правильно подготовить смартфон к продаже

Важные пункты, о которых многие забывают при продаже смартфона

Maxim
Да здравствует вчерашний день: почему мы так любим ностальгию Да здравствует вчерашний день: почему мы так любим ностальгию

По чему ностальгируют разные поколения?

РБК
Открыть в приложении