Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Будущее на носу Будущее на носу

Репортаж об успехах виртуальной реальности

Maxim
Осторожно, женщины! Осторожно, женщины!

Коллеги, которые создают доброжелательную атмосферу, — большая удача и редкость

Лиза
Насилию бой! Насилию бой!

Ответы на самые сложные и популярные вопросы о насилии

Maxim
Люди больше доверяют игрушечному роботу, чем антропоморфному Люди больше доверяют игрушечному роботу, чем антропоморфному

Почему людей так напрягают антропоморфные роботы?

ТехИнсайдер
Знакомьтесь, Ксения Лапшова! Знакомьтесь, Ксения Лапшова!

Ксения Лапшова создала главную российскую it-bag

Собака.ru
«У таких водителей проблемы»: что грозит за неостановку по просьбе ГИБДД «У таких водителей проблемы»: что грозит за неостановку по просьбе ГИБДД

Что грозит автомобилистам, не заметившим требование инспектора об остановке

РБК
Почему можно оживить замороженных лягушек, но не людей? Почему можно оживить замороженных лягушек, но не людей?

Как лягушкам удается возвращаться к жизни после «превращения в ледышки»?

ТехИнсайдер
Лучшая книга в истории человечества Лучшая книга в истории человечества

Существует ли роман или поэма, которые каждый обязан прочесть?

Maxim
Porsche Cayenne Turbo S E-Hybrid 2023 года. Пожалуй, лучший спортивный внедорожник Porsche Cayenne Turbo S E-Hybrid 2023 года. Пожалуй, лучший спортивный внедорожник

Porsche Cayenne Turbo S E-Hybrid — поверьте, он просто ошеломляет

4x4 Club
Невозможное возможно Невозможное возможно

10 страхов, которые мешают тебе добиться успеха в карьере

Лиза
Гренландия: как живут люди в краю фьордов и вечных льдов Гренландия: как живут люди в краю фьордов и вечных льдов

Чем знаменита Гренландия?

ТехИнсайдер
Все и сразу. Что такое здоровый гедонизм Все и сразу. Что такое здоровый гедонизм

Вести здоровый образ жизни и при этом не держать себя в ежовых рукавицах?

Новый очаг
Истории роста среди российских акций: стоит ли вкладываться и из чего выбрать Истории роста среди российских акций: стоит ли вкладываться и из чего выбрать

Часть из инвесторов обратили внимание на компании роста. Хорошая ли это идея?

Forbes
«Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика «Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика

Часто после расставания мы хотим слишком многого от будущего партнера

Psychologies
5 идей для тревел-девичника на 8 марта 5 идей для тревел-девичника на 8 марта

Если ты хочешь встретить 8 марта в компании близких подруг, у нас есть маршруты

Лиза
7 привычек, которые сохранят здоровье глаз 7 привычек, которые сохранят здоровье глаз

Повседневные привычки влияют на наши глаза гораздо сильнее, чем вы думаете

Новый очаг
Оазис гармонии Оазис гармонии

Стиль джапанди превратил обычную квартиру в комфортное место отдыха

Идеи Вашего Дома
Нюрнбергские расовые законы Нюрнбергские расовые законы

Антисемитизм лежал в основе нацистской идеологии

Дилетант
Культура насекомых, вулканы Венеры и бегемоты Пабло Эскобара: новости науки Культура насекомых, вулканы Венеры и бегемоты Пабло Эскобара: новости науки

Чем сапиенсы угрожали неандертальцам?

Forbes
Лекарство от депрессии Лекарство от депрессии

Как Вторая мировая сделала из США сверхдержаву

Деньги
Лес мук Лес мук

«Не стучи»: неторопливый финский хоррор

Weekend
Сколько на самом деле стоит автомобиль? Сколько на самом деле стоит автомобиль?

Жизнь автомобиля начинается задолго до момента, когда мы впервые садимся за руль

4x4 Club
Смертная уборка: мудрая шведская система наведения порядка, которая легче и понятнее, чем метод Мари Кондо Смертная уборка: мудрая шведская система наведения порядка, которая легче и понятнее, чем метод Мари Кондо

Дёстеднинг — шведское изобретение для обеспечения комфорта в доме

VOICE
Не работает клавиатура на компьютере или ноутбуке: что делать? Не работает клавиатура на компьютере или ноутбуке: что делать?

Почему клавиатура компьютера или ноутбука может перестать работать?

CHIP
Искусство и окрестности. 6 арт-пространств Подмосковья Искусство и окрестности. 6 арт-пространств Подмосковья

В Подмосковье есть множество арт-пространств, где проходят выставки и лекции

СНОБ
Беременная (опять) Рианна и Сальма в Беременная (опять) Рианна и Сальма в

Модный парад на "Оскаре-2023"

VOICE
На изящном: зачем Яеи Кусама раздевалась сама и раздевала других в своих антивоенных перформансах На изящном: зачем Яеи Кусама раздевалась сама и раздевала других в своих антивоенных перформансах

Как художники 60-х и 70-х выражали свои взгляды через телесные практики

Правила жизни
«Почему он мне не пишет»: гостинг, бенчинг, брэдкрампинг, мунинг — виды отвержения в онлайн-знакомствах «Почему он мне не пишет»: гостинг, бенчинг, брэдкрампинг, мунинг — виды отвержения в онлайн-знакомствах

Что делать, если вы стали жертвой «человека-призрака»?

Psychologies
Что можно сажать в марте: ранняя подготовка к богатому урожаю Что можно сажать в марте: ранняя подготовка к богатому урожаю

Март — идеальный месяц для посадки некоторых культур

ТехИнсайдер
Можно ли быть счастливым, несмотря ни на что? Можно ли быть счастливым, несмотря ни на что?

От чего зависит наше счастье?

Здоровье
Открыть в приложении