ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему так плохо, когда все хорошо Почему так плохо, когда все хорошо

Откуда приходит кризис среднего возраста и как не дать ему обрушить все

Men Today
«Мне важно участвовать в чем-то нужном людям» «Мне важно участвовать в чем-то нужном людям»

Зачем герои Марка Эйдельштейна платят стриптизершам

Правила жизни
Немирное «земледелие» Немирное «земледелие»

Как работает система залпового минирования

Популярная механика
Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак

Как эффективные технологии стали опасностью для IT-индустрии

Forbes
Нескончаемая молодость Нескончаемая молодость

Как русский рок стал зацикленным на самом себе

Weekend
Антидворянец: Макс Линдер Антидворянец: Макс Линдер

Слухи и сплетни о визите легендарной кинозвезды Макса Линдера в Петербург

Правила жизни
Кострома Кострома

Кострома — квинтэссенция русской жизни

КАНТРИ Русская азбука
Легенда №17 Легенда №17

Из чего состоят рутинные дела главы республики Тува

Men Today
«Можно весь день у телевизора сидеть, а мы выбрали наполненную жизнь»: как старший возраст становится временем для самореализации «Можно весь день у телевизора сидеть, а мы выбрали наполненную жизнь»: как старший возраст становится временем для самореализации

Как перестать бояться старости и научиться воспринимать новый для себя период.

СНОБ
Кострома: Личный опыт Кострома: Личный опыт

Впечатления автотуристов из Москвы, которые приехали в Кострому на уик-энд

КАНТРИ Русская азбука
Фуры: каких размеров и видов они бывают и что в них перевозят Фуры: каких размеров и видов они бывают и что в них перевозят

Какими бывают фуры, сколько стоят, с какой категорией можно за руль?

РБК
Расстройства сна: самые страшные болезни, связанные с недостатком качественного отдыха Расстройства сна: самые страшные болезни, связанные с недостатком качественного отдыха

Рассказываем о сонных недугах, пережить которые не пожелаешь даже врагу

ТехИнсайдер
Нефтяные качели Нефтяные качели

Что происходит с ценой на углеводороды

Деньги
«Другой человек»: трагикомедия о том, как мужчины тоже переживают о своей внешности «Другой человек»: трагикомедия о том, как мужчины тоже переживают о своей внешности

«Другой человек»: мрачная трагикомедия о кризисе идентичности

Forbes
Еду в Магадан Еду в Магадан

Куда отправиться в Магаданской области за невероятными впечатлениями?

Лиза
Станция «Кузнечное» Станция «Кузнечное»

Кузнечное дело во Владимире с инструкцией по выковке гвоздя

КАНТРИ Русская азбука
Несут какой-то вред Несут какой-то вред

Чем сложнее подход к тренингу, тем больше неверных шагов можно сделать

Men Today
В мыле: краткая история стирки от древнего Вавилона до наших дней В мыле: краткая история стирки от древнего Вавилона до наших дней

Как и чем чистили ткани до того, как начали сыпать белый порошок в лоток машинки

Правила жизни
«Его три дочери»: драма о сестринстве с Элизабет Олсен, Наташей Лионн и Кэрри Кун «Его три дочери»: драма о сестринстве с Элизабет Олсен, Наташей Лионн и Кэрри Кун

Как фильм «Его три дочери» переосмысляет тему сестринства

Forbes
Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу

Энанциорнис Avisaurus darwini достигал размеров ястреба и хватал добычу лапами

N+1
«Мы всегда готовы ко всему»: что мешает и помогает женщинам строить карьеру и бизнес «Мы всегда готовы ко всему»: что мешает и помогает женщинам строить карьеру и бизнес

Как женщины строили бизнес и карьеру в 2000-х, несмотря на гендерные стереотипы

Forbes
Русский Зондервег? Или немецкий «особый путь»? Русский Зондервег? Или немецкий «особый путь»?

«Особый путь» (нем. Sonderweg) — понятие столь же русское, сколь и немецкое

Дилетант
Зачем сверлить дыру в океане или Как работает маленький флот необычных научных кораблей Зачем сверлить дыру в океане или Как работает маленький флот необычных научных кораблей

5 научных открытий были сделаны на борту единственного судна Joides Resolution

ТехИнсайдер
Не кошкин дом: как спасают животных на стройках и в зонах реконструкции Не кошкин дом: как спасают животных на стройках и в зонах реконструкции

Можно ли гуманно справиться с проблемой бездомных животных в России?

Forbes
Хорошо забытое старое Хорошо забытое старое

Увидеть новый Ford и умереть? Ну, почти умереть – на обратном пути, от усталости

Автопилот
Крюки на ногах позволили роботу ANYmal вскарабкаться по приставной лестнице Крюки на ногах позволили роботу ANYmal вскарабкаться по приставной лестнице

Скорость подъема ANYmal в 232 раза превосходит результаты других роботов

N+1
«Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях «Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях

«Время жить»: мелодрама, ставшая пособием по здоровым отношениям

Forbes
Из почти полезного напитка в отраву: почему вино превращается в уксус Из почти полезного напитка в отраву: почему вино превращается в уксус

Почему вино может стать кислым и непригодным к употреблению?

ТехИнсайдер
История кино: почему в старых фильмах люди двигаются неестественно быстро? История кино: почему в старых фильмах люди двигаются неестественно быстро?

Почему в черно-белых фильмах у людей такие странные движения?

ТехИнсайдер
«Начинать нужно с пороха» «Начинать нужно с пороха»

Михаил Хубутия о форуме «ORЁLEXPO 2024» и проблемах отрасли товаров для охоты

Деньги
Открыть в приложении