ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ученые назвали главные факторы того, почему вы чувствуете себя уставшим Ученые назвали главные факторы того, почему вы чувствуете себя уставшим

Почему взрослые люди чувствуют себя постоянно уставшими?

ТехИнсайдер
4 японских принципа, которые спасут вас от тревоги 4 японских принципа, которые спасут вас от тревоги

Как думаете, что можно назвать лучшим лекарством от тревожности?

Psychologies
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Когда спорт не на пользу Когда спорт не на пользу

Но излишнее рвение в спорте, особенно у начинающих, может обернуться проблемами

Лиза
Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена

История Артема Жданова — о пути творческого человека в мире бизнеса

Inc.
Хронология событий Хронология событий

Алжирская война длилась с 1954 по 1962 год, но началось всё гораздо раньше

Дилетант
Москва зодиакальная Москва зодиакальная

Астрологическая карта столицы: выбери свой счастливый район

Лиза
7 типов «мамочек», которые раздражают всех в родительских чатах 7 типов «мамочек», которые раздражают всех в родительских чатах

Кто бесит в родительских чатах больше всего?

Psychologies
Даниил Шульгин Даниил Шульгин

Даниил Шульгин — звезда дизайна с уклоном в трэш-эстетику и древесный художник

Собака.ru
Стили езды. 10 главных трендов автодизайна Стили езды. 10 главных трендов автодизайна

Встречайте десять ключевых направлений движения индустрии автодизайна

Men Today
Что такое адаптивный круиз-контроль и чем он отличается от обычного Что такое адаптивный круиз-контроль и чем он отличается от обычного

Адаптивный круиз-контроль: что за устройство, в чем сильные и слабые стороны?

РБК
Их разыскивает Интерпол: какие инструменты защиты действуют при экстрадиции Их разыскивает Интерпол: какие инструменты защиты действуют при экстрадиции

Какие существуют инструменты защиты для тех, кто объявлен в международный розыск

Forbes
5 американских автопроизводителей, которые строили танки 5 американских автопроизводителей, которые строили танки

Автомобильные компании, которые во времена мировых войн начали выпускать танки

4x4 Club
Как выбрать спорт, который вам точно подойдет: советы врача Как выбрать спорт, который вам точно подойдет: советы врача

На что важно обращать внимание при выборе спортивной активности

Psychologies
Город-текст, пытающийся вырваться из своего контекста Город-текст, пытающийся вырваться из своего контекста

Екатеринбург: архитектура советского корпоративного проекта

Weekend
Как отстирать белые носки без использования отбеливателя: 5 методов, проверенных временем Как отстирать белые носки без использования отбеливателя: 5 методов, проверенных временем

Сделать носки снова белоснежно чистыми не так уж и сложно!

ТехИнсайдер
Африканские маски в Москве Африканские маски в Москве

Маски, затягивающие в свой потаенный запредельный мир колдовства и мистики…

Знание – сила
Как общаться с партнером, чтобы не разрушить отношения Как общаться с партнером, чтобы не разрушить отношения

Почему мы не можем найти взаимопонимание в отношениях?

Psychologies
Всё под рукой Всё под рукой

Как правильно расставить бытовую технику на кухне

Лиза
Озон под угрозой из космоса Озон под угрозой из космоса

Природные факторы, ослабляющие озоновый слой Земли

Санкт-Петербургский университет
«ПСБ стал цифровым хабом для своих клиентов» «ПСБ стал цифровым хабом для своих клиентов»

Алексей Захаров о том, как идет модернизация оборонно-промышленного комплекса

Деньги
Дожди еще впереди: как выбрать качественный зонт, который не подведет в плохую погоду Дожди еще впереди: как выбрать качественный зонт, который не подведет в плохую погоду

На какие факторы нужно обращать внимание при покупке зонта

ТехИнсайдер
«Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить «Мыльная опера» или «выдохшаяся газировка»: 8 типов расставаний и как их пережить

Как пережить расставание?

Psychologies
Почему кошек ни в коем случае нельзя брать за шкирку? Ведь мамы-кошки именно так и делают Почему кошек ни в коем случае нельзя брать за шкирку? Ведь мамы-кошки именно так и делают

Что чувствует кот, подвешенный за шкирку и почему делать так нельзя?

ТехИнсайдер
Субурбан-мобиль Субурбан-мобиль

Шок! Внедорожника Haval H5 выросло на удивление много!

Автопилот
«Багров – убийца, который покрошил за брата пол-Петербурга» «Багров – убийца, который покрошил за брата пол-Петербурга»

Артем Быстров о 1990-х и перевоплощении в таежного охотника

Правила жизни
Счастье в отношениях: 4 этапа, которые проходит пара Счастье в отношениях: 4 этапа, которые проходит пара

Счастливые долгосрочные отношения: что они из себя представляют?

Psychologies
Зачем люди делают громкий выхлоп на машине Зачем люди делают громкий выхлоп на машине

Люди решили спросить спонсоров бессонницы и владельцев громкого выхлопа напрямую

Maxim
Как домохозяйка Джеральдин Вайс стала первой женщиной — инвестиционным консультантом Как домохозяйка Джеральдин Вайс стала первой женщиной — инвестиционным консультантом

Почти 11 лет инвесторы не знали, что консультант «Дж. Вайс» — женщина

Forbes
Историк о диалоге как пути мировой культуры Историк о диалоге как пути мировой культуры

Какую роль играет умение обращать свои мысли к собеседнику?

РБК
Открыть в приложении