ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Александр Крайнов: «Нейросеть не заменит людей в общении, размышлении и умении договариваться» Александр Крайнов: «Нейросеть не заменит людей в общении, размышлении и умении договариваться»

Как нейросети повлияют на профессии и когда они станут привычным инструментом

РБК
Гаджеты на колесах Гаджеты на колесах

Во сколько обходятся россиянам автомобильные инновации

Деньги
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Есть научное объяснение тому, почему у пчел соты не круглые, а в виде шестиугольников Есть научное объяснение тому, почему у пчел соты не круглые, а в виде шестиугольников

Пчелы, не зная математики, строят свои соты в форме шестиугольника. Почему?

ТехИнсайдер
Правда ли, что штампованные диски в зиму лучше, чем литые: 1 плюс против 3 минусов Правда ли, что штампованные диски в зиму лучше, чем литые: 1 плюс против 3 минусов

Зимой нужно переходить на стальные штампованные диски. Почему?

ТехИнсайдер
Страшное слово ОАС Страшное слово ОАС

Аббревиатура ОАС в начале 1960-х наводила ужас на всю Францию

Дилетант
Алина Кугуш Алина Кугуш

Перформер Алина Кугуш в фэшн-арт-объект превращает себя сама

Собака.ru
Экономическое поле экспериментов Экономическое поле экспериментов

Как полевые испытания на людях помогают экономическому развитию

N+1
Кирилл Гребенщиков Кирилл Гребенщиков

Кирилл Гребенщиков об особенностях игры в сериале «Наследники. Дар крови»

Лиза
Более половины зумеров считают критику в свой адрес на работе знаком личной неприязни Более половины зумеров считают критику в свой адрес на работе знаком личной неприязни

Зумеры воспринимает критику в свой адрес на работе как знак личной неприязни

Forbes
Как домохозяйка Джеральдин Вайс стала первой женщиной — инвестиционным консультантом Как домохозяйка Джеральдин Вайс стала первой женщиной — инвестиционным консультантом

Почти 11 лет инвесторы не знали, что консультант «Дж. Вайс» — женщина

Forbes
Прошу к барьеру! Прошу к барьеру!

Можно ли доверять презервативу полностью в деле защиты от инфекций?

Лиза
Николай Островский Николай Островский

У Николая Островского война гражданская, а тюрьма герою не выпала

Дилетант
Очень скучное кино: почему список рекомендуемых фильмов вряд ли понравится школьникам Очень скучное кино: почему список рекомендуемых фильмов вряд ли понравится школьникам

Почему список фильмов, рекомендованных для школьников, очень скучный

Forbes
Cмешай и соедини! Cмешай и соедини!

Сбрасываем вес, не испытывая чувства голода

Лиза
Гигант микрофинансирования Гигант микрофинансирования

Чем прославился глава временного правительства Бангладеш

Деньги
Валентина Шарыкина: «Путевку в актерскую жизнь мне дал Миронов...» Валентина Шарыкина: «Путевку в актерскую жизнь мне дал Миронов...»

«В Театре сатиры актеров, занятых в «Кабачке», называли «халтурщиками»

Коллекция. Караван историй
Кто изобрел науку Кто изобрел науку

Разбираемся в почти детективной истории зарождения науки

Вокруг света
Осенние эфемероиды Осенние эфемероиды

На фоне конфетти из опавшей листвы не унимается ликование осенних цветов

Наука и жизнь
Что происходит в мозге человека, когда он смотрит на шедевр Вермеера Что происходит в мозге человека, когда он смотрит на шедевр Вермеера

Ученые измерили реакцию мозга при просмотре картины Йоханнеса Вермеера

ТехИнсайдер
Пираты XXI века: как устроен рынок книжного самиздата и нелегальных переводов Пираты XXI века: как устроен рынок книжного самиздата и нелегальных переводов

Литературный обозреватель разбирается, как устроен рынок современного самиздата

Forbes
Алексей Новиков: «Кибербезопасность становится несущей конструкцией для бизнеса» Алексей Новиков: «Кибербезопасность становится несущей конструкцией для бизнеса»

Почему русский кибербез интересен мировому сообществу

РБК
Легенда №17 Легенда №17

Из чего состоят рутинные дела главы республики Тува

Men Today
Зоологи допустили существование 30 тысяч видов и подвидов дождевых червей Зоологи допустили существование 30 тысяч видов и подвидов дождевых червей

Как ученые оценили разнообразие дождевых червей на планете

N+1
Единственный протокол стимуляции тета-вспышками уменьшил симптомы шизофрении Единственный протокол стимуляции тета-вспышками уменьшил симптомы шизофрении

Стимуляция тета-вспышками снижает симптоматику у пациентов с шизофренией

N+1
Как понять, что вам нужно мыть голову чаще Как понять, что вам нужно мыть голову чаще

Как понять, что вы моете кожу головы недостаточно часто?

ТехИнсайдер
Самые шокирующие продукты, которые съедали домашние животные Самые шокирующие продукты, которые съедали домашние животные

Опрос выявил самые странные вещи, которые наши любимцы не против проглотить

ТехИнсайдер
Целование ручки злодея Целование ручки злодея

Гением Пушкина Александру Шванвичу была суждена долгая жизнь в образе Швабрина

Дилетант
«Вдох-выдох — тут уже есть повтор» «Вдох-выдох — тут уже есть повтор»

Как из повторов рождаются стихи и что с ними делают разные авторы

Weekend
Тень учителя Тень учителя

Василий Степанов о Мэгги Смит

Weekend
Открыть в приложении