Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Космос как развлечение Космос как развлечение

Какие у нас перспективы посмотреть на Землю из космоса

Популярная механика
Да здравствует вчерашний день: почему мы так любим ностальгию Да здравствует вчерашний день: почему мы так любим ностальгию

По чему ностальгируют разные поколения?

РБК
Почему рыбным днём считается именно четверг? Почему рыбным днём считается именно четверг?

Почему из всех семи дней в недели рыбным днем выбрали именно четверг?

ТехИнсайдер
Квартира-ловушка Квартира-ловушка

5 признаков риелторов-мошенников: как вовремя распознать обман при покупке жилья

Лиза
Как устроен гибридный автомобиль и какие виды гибридов представлены на рынке Как устроен гибридный автомобиль и какие виды гибридов представлены на рынке

Гибридный автомобиль – вещь очень модная, а для многих – еще и загадочная

ТехИнсайдер
Хелена Побяржина: «Валсарб» Хелена Побяржина: «Валсарб»

Необычный роман о личной и исторической памяти

СНОБ
Как Land Cruiser, но вдвое дешевле: в России представили Tank 500 Как Land Cruiser, но вдвое дешевле: в России представили Tank 500

Большой рамный китайский внедорожник Tank 500 добрался до российского рынка

РБК
И хочется, и надо, но лень не дает... И хочется, и надо, но лень не дает...

14 нескучных мотиваций для похудения

Лиза
20 самых знаковых моментов за всю историю премии «Оскар» 20 самых знаковых моментов за всю историю премии «Оскар»

Самые важные, яркие и курьезные моменты за всю историю премии «Оскар»

Правила жизни
Работа с пограничным расстройством личности: техника ментализации Работа с пограничным расстройством личности: техника ментализации

Как распознать человека с пограничным расстройством личности?

Psychologies
Сохранить себя Сохранить себя

Как пережить темные времена, не впасть в отчаяние, не поддаться страхам?

Robb Report
Почему финансовые маневры Binance до боли напоминают последние махинации FTX Почему финансовые маневры Binance до боли напоминают последние махинации FTX

Придумывать правила на рынке крупнейшей в мире криптобирже легче на ходу

Forbes
Недоброе тепло: как грузинские дровосеки нашли советские «атомные батарейки» Недоброе тепло: как грузинские дровосеки нашли советские «атомные батарейки»

Из этой статьи ты узнаешь о людях, которые согрелись с помощью радиации

Maxim
Не до шуток: можно ли на самом деле умереть от смеха? Не до шуток: можно ли на самом деле умереть от смеха?

Что будет, если смеяться слишком долго?

ТехИнсайдер
«Какая мерзость»: как издательство No Kidding Press выпускает в России фем-литературу «Какая мерзость»: как издательство No Kidding Press выпускает в России фем-литературу

Как живет издательство, которое переводит и издает книги, написанные женщинами

Forbes
По рыбным местам По рыбным местам

Куда лучше отправиться в этом году на рыбалку

Деньги
Отсутствие друзей и равнодушие к собакам: как распознать низкий эмоциональный интеллект партнера — 12 признаков Отсутствие друзей и равнодушие к собакам: как распознать низкий эмоциональный интеллект партнера — 12 признаков

Как определить человека, обладающего низким эмоциональным интеллектом?

Psychologies
Первая русская манифестация Первая русская манифестация

С юности Владимир Новосильцев был, как казалось, настоящим баловнем судьбы

Дилетант
Искусство и окрестности. 6 арт-пространств Подмосковья Искусство и окрестности. 6 арт-пространств Подмосковья

В Подмосковье есть множество арт-пространств, где проходят выставки и лекции

СНОБ
Макар Кожухов, заместитель генерального директора Premier: Онлайн-кинотеатры — это новые библиотеки Макар Кожухов, заместитель генерального директора Premier: Онлайн-кинотеатры — это новые библиотеки

Заместитель генерального директора Premier — о герое нашего времени и аналитике

СНОБ
Русский перевод: начало Русский перевод: начало

Вспоминаем полемику, которая сопровождала рождение русской переводческой школы

Полка
Что такое прокрастинация и как с ней бороться: практические советы от предпринимателя Что такое прокрастинация и как с ней бороться: практические советы от предпринимателя

Чем прокрастинация отличается от лени?

Psychologies
Фигура на фоне Холодной войны Фигура на фоне Холодной войны

Как художник Евгений Рухин вел американский образ жизни в застойном Ленинграде

Weekend
Синдром злой мачехи: как взрослой дочери наладить отношения с контролирующей матерью Синдром злой мачехи: как взрослой дочери наладить отношения с контролирующей матерью

О том, почему у повзрослевших дочерей часто разрушаются отношения с матерями

Forbes
Музыкант Павел Артемьев: Нас мало и нам нужно держаться вместе Музыкант Павел Артемьев: Нас мало и нам нужно держаться вместе

Мы поговорили с фронтменом коллектива ARTEMIEV Павлом Артемьевым

СНОБ
Хаос в полях: рынок загородной недвижимости никак не выберется из депрессии Хаос в полях: рынок загородной недвижимости никак не выберется из депрессии

Затянувшееся ожидание нового предложения и вера в растущий потенциальный спрос

Forbes
Трагические судьбы известных супермоделей Трагические судьбы известных супермоделей

Пока все восхищались и завидовали этим моделям, они переживали настоящие драмы

VOICE
Не для детских ушей Не для детских ушей

6 вещей, которые ни в коем случае нельзя делать при ребенке

Лиза
Перерыв на кофе Перерыв на кофе

7 секретов приготовления кофе, которые знают бариста, а теперь и ты

Лиза
Любители одиночества: 10 фактов о манулах, самых сердитых котах России Любители одиночества: 10 фактов о манулах, самых сердитых котах России

Топ-10 фактов о манулах

ТехИнсайдер
Открыть в приложении