Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Испытание огнем Испытание огнем

Современные газотурбинные двигатели в гражданской авиации — воплощение хай-тека

Популярная механика
Вторые на Луне Вторые на Луне

Как продвигается работа над космической программой Artemis?

ТехИнсайдер
Секстинг вместо секса Секстинг вместо секса

Не секстинг виноват в том, что исследователи называют кризисом секса

Playboy
Почему головные боли приводят к старению и слабоумию: отрывок из новой книги доктора Бубновского Почему головные боли приводят к старению и слабоумию: отрывок из новой книги доктора Бубновского

Про то, почему так опасно не уделять внимание устранению головных болей

VOICE
Константин Куприянов: «Музей “Калифорния”» Константин Куприянов: «Музей “Калифорния”»

Отрывок из романа «Музей “Калифорния”», вышедшего в издательстве «Городец»

СНОБ
Всё сначала Всё сначала

Turquoise Yachts продолжает работу над необычным для себя проектом Rainbow II

Y Magazine
Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго

Разбираемся в тонкостях жизни в разных странах Юго-Восточной Азии

Forbes
Почему их так называют? Как автопроизводители выбирают имена для электромобилей Почему их так называют? Как автопроизводители выбирают имена для электромобилей

Имя может создать автомобиль, а может его уничтожить

4x4 Club
Самые странные русские обряды: зачем запекать ребенка в печи, запрягать баб и ехать хоронить мух? Самые странные русские обряды: зачем запекать ребенка в печи, запрягать баб и ехать хоронить мух?

Какой поговоркой можно охарактеризовать русский народ?

ТехИнсайдер
Александр Долгих. Про скорость, концентрацию и количество аварий Александр Долгих. Про скорость, концентрацию и количество аварий

Водить машину не так уж и сложно

4x4 Club
Полина Бондарева Полина Бондарева

Полина Бондарева открывает культурный центр в здании Левашовского хлебозавода

Собака.ru
Линейная служба Линейная служба

Ижевские беспилотники Supercam не игрушки для миллениалов, а серьезные машины

ТехИнсайдер
«Советская повседневность» «Советская повседневность»

Отрывок из книги «Советская повседневность: нормы и аномалии»

N+1
Да, сезон! Тест-драйв новой бюджетной линейки шин Cordiant Да, сезон! Тест-драйв новой бюджетной линейки шин Cordiant

Тестируем новые шины Crodiant Graviti

РБК
Правила использование реечного домкрата. Шесть шагов Правила использование реечного домкрата. Шесть шагов

Самый старинный помощник на бездорожье – реечный домкрат

4x4 Club
На изящном: история скандальной картины «Происхождение мира» Гюстава Курбе На изящном: история скандальной картины «Происхождение мира» Гюстава Курбе

«Происхождение мира»: почему эта картина Гюстава Курбе вызвала такой ожиотаж?

Правила жизни
Создана полная карта мозга дрозофилы. Он очень похож на искусственную нейросеть Создана полная карта мозга дрозофилы. Он очень похож на искусственную нейросеть

Создана самая сложная на сегодня карта мозга насекомого

ТехИнсайдер
«Что увидела Кассандра»: истории женщин, балансирующих на грани нервного срыва «Что увидела Кассандра»: истории женщин, балансирующих на грани нервного срыва

Несколько обычных историй, которые случаются постоянно

Forbes
В это сложно поверить: как выглядели овощи и фрукты, пока их не коснулась рука селекционера В это сложно поверить: как выглядели овощи и фрукты, пока их не коснулась рука селекционера

Раньше овощи и фрукты выглядели совсем иначе

ТехИнсайдер
Универсальный вариант Универсальный вариант

Однокомнатная квартира с универсальной планировкой

Идеи Вашего Дома
Ради блога Ради блога

Insight People стало крупнейшим креативным кластером в России

Robb Report
5 невероятных технологий будущего, которыми мы пользуемся каждый день 5 невероятных технологий будущего, которыми мы пользуемся каждый день

Еще несколько лет назад о таких технологиях только мечтали писатели-фантасты

Maxim
Делаем аватарки с помощью нейросети: какой сервис лучше Делаем аватарки с помощью нейросети: какой сервис лучше

Какая из нейросетей лучше всего подходит для создания аватарки?

CHIP
В коллайдере удалось зафиксировать «неуловимые» частицы В коллайдере удалось зафиксировать «неуловимые» частицы

Новая работа представляет собой первое прямое наблюдение коллайдерных нейтрино

ТехИнсайдер
Ольга Лерман: «Берегите родных вашему сердцу и душе людей. А все остальное можно пережить» Ольга Лерман: «Берегите родных вашему сердцу и душе людей. А все остальное можно пережить»

Было странно сидеть без работы и участвовать в основном в массовых сценах

Коллекция. Караван историй
«Валсарб»: отрывок из книги о девочке, которая хранит чужую память «Валсарб»: отрывок из книги о девочке, которая хранит чужую память

Отрывок из книги «Валсарб» — о девочке, которая слышит голоса умерших людей

Forbes
7 удобных клавиатур для Android: для аскетов и любителей эмодзи 7 удобных клавиатур для Android: для аскетов и любителей эмодзи

Мы собрали лучшие клавиатуры из того, что можно найти в Google Play Store

CHIP
Вложись по минимуму Вложись по минимуму

Как стать инвестором, даже если в кармане всего 500 рублей

Лиза
Балерина Анита Пудикова, сыгравшая близняшек-роботов, рассказала, как попала во вселенную Atomic Heart Балерина Анита Пудикова, сыгравшая близняшек-роботов, рассказала, как попала во вселенную Atomic Heart

Анита Пудикова — о компьютерных играх, технологиях и балете

Maxim
Как планеты спасают воду от слишком активных звезд: неожиданное исследование Как планеты спасают воду от слишком активных звезд: неожиданное исследование

Планета может сохранить воду, даже если её омывали потоки солнечной радиации

ТехИнсайдер
Открыть в приложении