Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению.

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%.

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Меньше галлюцинаций

Рекомендуемые статьи

Ученые разработали новый метод изучения древней атмосферы

Алексей Захаров о том, как идет модернизация оборонно-промышленного комплекса

Зачем нужна биометрия и как ее использовать в России

Можно ли выращивать новые волосяные фолликулы в коже?

Почему бы не заняться разбором гардероба прямо сейчас?

Владимир — особенный город с особенными достопримечательностями

Что же движет человеком в супермаркете?

Вспоминаем вкус домашнего кваса, морсов и «газировки» из СССР

Как улучшить состояние кожи при кожных заболеваниях – рекомендации нутрициолога

Как, никого не обидев, освободиться от влияния родителя

Почему вино может стать кислым и непригодным к употреблению?

«Джекпот» — лучший фильм Александра Ханта

«Умные города», где искусственный интеллект делает жизнь людей удобнее

Изношенный «опорник» вызывает шумы и усиливает износ элементов подвески

«А знаете ли, что у алжирского дея под самым носом шишка?»

Лукия Мурина и Николай Исаев: служба охраны памяти

Осени к лицу желтый цвет, чего не скажешь о ваших зубах. Как сделать их белыми?

Биомолекулы, липиды, могут сохранять свою структуру в серной кислоте Венеры

Телеведущая Аврора о нутрициологии, блефаропластике и роли эндокринолога

Какие мультики помогают детям формировать эмоциональный интеллект

Первый случай, когда синюю акулу пронзила меч-рыба, и она выжила

5 способов потерять деньги, покупая или продавая вещи в Интернете

Истории выживания на большой воде

Стремление соответствовать образу «настоящего мужчины» может стоить вам жизни

Финифть — легендарное искусство родом из Ростова Великого

Давайте разберемся, почему «этическое не лечится»

Как российский бизнес с помощью господдержки осваивает новые рынки

Каким окажется будущее российской экономики

Астрологическая карта столицы: выбери свой счастливый район

«Королевство»: полудокументальная драма про выпускной