Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Земля ратного подвига Земля ратного подвига

Щит России: чем живёт и развивается Белгородская область сегодня

Отдых в России
Как в мире борются с незаконным выловом кальмара Как в мире борются с незаконным выловом кальмара

Чем незаконный вылов грозит кальмарам?

СНОБ
12 самых годных сериалов с откровенными сценами 12 самых годных сериалов с откровенными сценами

Лучшие пикантные шоу!

Maxim
Архитектура Архитектура

Революция даже архитектуре придавала нездоровый драматизм

Правила жизни
Что такое Mazda CX-50 и какое место она занимает в модельной линейке компании Что такое Mazda CX-50 и какое место она занимает в модельной линейке компании

Mazda CX-50 верна философии бренда

4x4 Club
Археологи нашли древнейшие лук и стрелы в мире — им больше 54 000 лет Археологи нашли древнейшие лук и стрелы в мире — им больше 54 000 лет

Древние люди изготавливали луки и стрелы в Европе еще 54 000 лет назад

ТехИнсайдер
В коллайдере удалось зафиксировать «неуловимые» частицы В коллайдере удалось зафиксировать «неуловимые» частицы

Новая работа представляет собой первое прямое наблюдение коллайдерных нейтрино

ТехИнсайдер
Укололи и — пошел: главные тренды в инъекционной косметологии Укололи и — пошел: главные тренды в инъекционной косметологии

Как современные косметологи помогают коже не стареть?

Forbes
Отрывок из книжного сериала Антон Секисова «Комната Вагинова» Отрывок из книжного сериала Антон Секисова «Комната Вагинова»

Жизнь в петербургской коммуналке глазами Антона Секисова

СНОБ
Как правильно хранить зимние вещи Как правильно хранить зимние вещи

Несколько лайфхаков, чтобы обезопасить теплую одежду от моли, плесени и грибка

Maxim
Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго Курс на юго-восток: как переехать в тропическую страну и можно ли там жить долго

Разбираемся в тонкостях жизни в разных странах Юго-Восточной Азии

Forbes
Плюсы и минусы самостоятельного ремонта ваших гаджетов Плюсы и минусы самостоятельного ремонта ваших гаджетов

Следует ли вам починить свой треснувший экран самостоятельно?

ТехИнсайдер
Угол презрения Угол презрения

Русские футуристы пытались освистать Маринетти так, чтобы ему это не польстило

Правила жизни
И такое возможно: а вы знали, что женщина может сразу забеременеть от двоих мужчин? И такое возможно: а вы знали, что женщина может сразу забеременеть от двоих мужчин?

Можно ли повторно забеременеть во время беременности?

ТехИнсайдер
Жертва кризиса доверия: почему закончилась полуторавековая история Credit Suisse Жертва кризиса доверия: почему закончилась полуторавековая история Credit Suisse

Что привело Credit Suisse к тупику, из которого он оказался не в состоянии выйти

Forbes
Как выглядеть дорого, но покупать мало вещей: совет стилиста Как выглядеть дорого, но покупать мало вещей: совет стилиста

Как насмотренность и умение выбирать одежду по запросу помогает сэкономить

VOICE
Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов Никакого сходства с реальностью: почему в Средневековье рисовали таких нелепых львов

Искусство средневековых художников не отличалось реалистичностью изображения

ТехИнсайдер
Позвольте Ремарку. Почему новая экранизация «На Западном фронте без перемен» войдет в историю, даже если не выиграет «Оскар» Позвольте Ремарку. Почему новая экранизация «На Западном фронте без перемен» войдет в историю, даже если не выиграет «Оскар»

«На Западном фронте без перемен» — самая страшная экранизация романа Ремарка

Правила жизни
Позитивные аффирмации: обман или очень полезное упражнение? Позитивные аффирмации: обман или очень полезное упражнение?

Верите ли вы, что наши мысли формируют наше окружение и восприятие реальности?

ТехИнсайдер
В погоне за опытом: как сегодня путешествуют по России В погоне за опытом: как сегодня путешествуют по России

Почему россияне предпочитают Камчатку, Алтай и Таймыр поездкам за границу?

Forbes
Какой шанс встретить идеального партнера: математические аспекты любви — проверьте на практике Какой шанс встретить идеального партнера: математические аспекты любви — проверьте на практике

Применимы ли математические методы к любовному поиску?

Psychologies
Правила жизни Спайка Ли Правила жизни Спайка Ли

Правила жизни режиссера Спайка Ли

Правила жизни
Харизматическая энергетика и демонические черты: как в моде появилось понятие cool Харизматическая энергетика и демонические черты: как в моде появилось понятие cool

Отрывок из книги о понятии cool и переломных моментах в истории моды

Forbes
Могут ли существовать планеты, состоящие из темной материи? И, если да, то как их обнаружить? Могут ли существовать планеты, состоящие из темной материи? И, если да, то как их обнаружить?

Но что, если в космосе есть планеты, состоящие из частиц вне Стандартной модели?

ТехИнсайдер
Криминальный тур для искателей приключений: 6 захватывающих детективов из разных стран Криминальный тур для искателей приключений: 6 захватывающих детективов из разных стран

О таком туристические агентства не рассказывают в рекламных буклетах!

Maxim
Великий пост: кто, почему и зачем отказывается от еды — истории читательниц и комментарии психологов Великий пост: кто, почему и зачем отказывается от еды — истории читательниц и комментарии психологов

В чем смысл длительного физического и духовного воздержания?

Psychologies
Как люди отреагировали на смерть Сталина? Прочтите эти воспоминания! Как люди отреагировали на смерть Сталина? Прочтите эти воспоминания!

Тревога, радость и всенародное горе — как люди восприняли кончину Сталина

ТехИнсайдер
Любит — не любит? Как знаки зодиака выражают свои чувства Любит — не любит? Как знаки зодиака выражают свои чувства

Как понять, влюблен в тебя твой Овен или нет.?

VOICE
Беременная (опять) Рианна и Сальма в Беременная (опять) Рианна и Сальма в

Модный парад на "Оскаре-2023"

VOICE
«Город девушек»: как сделать пространство комфортным и безопасным для женщин «Город девушек»: как сделать пространство комфортным и безопасным для женщин

Глава из книги «Феминистский город. Полевое руководство для горожанок»

Forbes
Открыть в приложении