ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Символ на перекрестке современных философий Символ на перекрестке современных философий

Знак — это условность, которая превращает отдельные вещи в их меру

Знание – сила
Валерия Федорович: «После «Кухни» мне ничего не страшно» Валерия Федорович: «После «Кухни» мне ничего не страшно»

Думала: что ему до моих проблем? А он отнесся ко мне по-человечески

Караван историй
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Унюхал – беги: как трупный запах влияет на поведение человека Унюхал – беги: как трупный запах влияет на поведение человека

Как «запах смерти» мобилизует защитные механизмы в нашем организме

ТехИнсайдер
Как Аватар пришел на помощь Чебурашке Как Аватар пришел на помощь Чебурашке

Как пиратский прокат фильмов позволяет кинотеатрам закрывать финансовую брешь

Монокль
Стихийные отношения Стихийные отношения

Громкие заявления о подъеме уровня океана голландцы не слышат, а видят

Вокруг света
На этой реке убрали все каналы, защищавшие берег от наводнений. Наводнений стало меньше На этой реке убрали все каналы, защищавшие берег от наводнений. Наводнений стало меньше

Почему рекам возвращают естественные изгибы, омуты и пойменные земли

ТехИнсайдер
Саддам Хусейн, отец нации Саддам Хусейн, отец нации

Самым печально известным из кровавых диктаторов Ирака былл Саддам Хусейн

Дилетант
Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast

Autonews.ru испытал самый мощный Tesla Cybertruck Beast в мире: плюсы и минусы

РБК
Кофейно-чайная зависимость страны Кофейно-чайная зависимость страны

Есть ли возможность увеличить долю сырья на рынке горячих напитков России

Агроинвестор
«Художник обидеть может каждого!» «Художник обидеть может каждого!»

Разные грани и тайны профессии от режиссера Михаила Цитриняка

Знание – сила
Я наблюдаю не первую волну революционных взглядов в искусстве — Аристарх Чернышев Я наблюдаю не первую волну революционных взглядов в искусстве — Аристарх Чернышев

Ольга Вад поговорила с Аристархом Чернышевым о технологии создания медиаработ

СНОБ
Бег по наклонной Бег по наклонной

Мог бы уровень современной науки позволить создать Человека-паука?

Вокруг света
Сама себе режиссер Сама себе режиссер

Ирина Горбачёва в фильме «Говорит Земля!» играет экоактивистку

OK!
5 новых американских кроссоверов, которые появились в России. Фото и цены 5 новых американских кроссоверов, которые появились в России. Фото и цены

Какие новые американские кроссоверы привозят в Россию дилеры

РБК
Нобелевская премия мимо Нобелевская премия мимо

9 убедительных причин отказаться от награды

Weekend
Он всё забывает! Он всё забывает!

Откуда у ребенка берутся проблемы с рабочей памятью и как ему помочь

Здоровье
12 способов, которыми ты портишь маникюр, сама об этом не зная 12 способов, которыми ты портишь маникюр, сама об этом не зная

Почему лак на следующий же день после маникюра скалывается?

VOICE
Как общаться с партнером, чтобы не разрушить отношения Как общаться с партнером, чтобы не разрушить отношения

Почему мы не можем найти взаимопонимание в отношениях?

Psychologies
Что такое «мужской грипп» и существует ли он: только наука Что такое «мужской грипп» и существует ли он: только наука

Болеют ли мужчины как-то особенно?

ТехИнсайдер
Зоологи допустили существование 30 тысяч видов и подвидов дождевых червей Зоологи допустили существование 30 тысяч видов и подвидов дождевых червей

Как ученые оценили разнообразие дождевых червей на планете

N+1
«Папа умер в субботу»: драма о том, как понять и простить собственную семью «Папа умер в субботу»: драма о том, как понять и простить собственную семью

Как картина «Папа умер в субботу» оказывается пронзительным фильмом о прощении

Forbes
Инновации решают Инновации решают

Каким окажется будущее российской экономики

Деньги
Фононы оказались главными виновниками теплового планарного эффекта Холла Фононы оказались главными виновниками теплового планарного эффекта Холла

Физики поставили под сомнение причины, по которым возникает эффект Холла

N+1
Девочки не умеют терпеть: что такое pain gap и почему женщины чаще испытывают боль Девочки не умеют терпеть: что такое pain gap и почему женщины чаще испытывают боль

Как стереотипы и недостаток знаний о женском теле делают нам больно

Forbes
Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена

История Артема Жданова — о пути творческого человека в мире бизнеса

Inc.
Гении места Гении места

Лукия Мурина и Николай Исаев: служба охраны памяти

Weekend
Буржуйка в изразцах Буржуйка в изразцах

Изразцы Ярославля как источник вдохновения для строительства печки на своей даче

КАНТРИ Русская азбука
Гениальные изобретатели, которые так и не смогли прославиться и разбогатеть: 5 грустных историй Гениальные изобретатели, которые так и не смогли прославиться и разбогатеть: 5 грустных историй

Блестящий изобретательский ум и предпринимательская жилка не всегда идут в паре

ТехИнсайдер
Богатство не для всех Богатство не для всех

Почему в мире растет разрыв в доходах

РБК
Открыть в приложении