ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Обсессивно-компульсивное расстройство: что это такое, как распознать и чем лечить Обсессивно-компульсивное расстройство: что это такое, как распознать и чем лечить

Как распознать грань, после которой наши ритуалы мешают жить?

Psychologies
Вы поразитесь! Вот для чего на самом деле была изобретена пузырчатая пленка Вы поразитесь! Вот для чего на самом деле была изобретена пузырчатая пленка

Раньше знаменитую «пупырку» использовали совершенно иначе

ТехИнсайдер
Город, сбросивший историческую память Город, сбросивший историческую память

Архангельск: морозное процветание новой стабильности

Weekend
Когда спорт не на пользу Когда спорт не на пользу

Но излишнее рвение в спорте, особенно у начинающих, может обернуться проблемами

Лиза
5 новых американских кроссоверов, которые появились в России. Фото и цены 5 новых американских кроссоверов, которые появились в России. Фото и цены

Какие новые американские кроссоверы привозят в Россию дилеры

РБК
Михаил Куницын: «Я всю ночь не спал в доме Орловой, думал, как спасти это все?» Михаил Куницын: «Я всю ночь не спал в доме Орловой, думал, как спасти это все?»

«Часть наследия Орловой все-таки оказалась в Бахрушинском музее»

Коллекция. Караван историй
8 книг про настоящих шпионов 8 книг про настоящих шпионов

Реальные истории разведчиков из разных стран, включая КГБ, ЦРУ и «Моссад»

СНОБ
Быки, медведи и плечи: словарик успешного инвестора Быки, медведи и плечи: словарик успешного инвестора

Про 15 базовых терминов, которые позволят вам стать Волком с Уолл-Стрит

Maxim
Так «бомж-пакет» или деликатес? 10 неожиданных фактов о лапше быстрого приготовления Так «бомж-пакет» или деликатес? 10 неожиданных фактов о лапше быстрого приготовления

Чего вы не знали о лапше быстрого приготовления

ТехИнсайдер
Пожары семейных страстей: как дети воспринимают сложные эмоции взрослых Пожары семейных страстей: как дети воспринимают сложные эмоции взрослых

О влиянии недовольства, гнева и обид в отношениях родителей на ребенка

Forbes
Утилистический прием Утилистический прием

Как Константин Вагинов изобрел безотходную переработку прошлого

Weekend
Игорь Бутман: «Вся наша жизнь – это импровизация» Игорь Бутман: «Вся наша жизнь – это импровизация»

Игорь Бутман о планах на будущее и любви к импровизации

Grazia
Генеральная уборка. Как правильно подготовить сад к зимней спячке Генеральная уборка. Как правильно подготовить сад к зимней спячке

В октябре самое время засучить рукава и подготовить сад к зимней спячке

Лиза
Яркий сжатый вакуум сгенерировал высокие гармоники Яркий сжатый вакуум сгенерировал высокие гармоники

Физики сгенерировали высокие гармоники в магний-легированном ниобате лития

N+1
Искусственный отбор: что не так с венчурными фондами в России Искусственный отбор: что не так с венчурными фондами в России

Почему российский венчурный рынок пока существенно отстает от мировых лидеров

Forbes
Квазипериодические рентгеновские вспышки вновь связали с событиями приливного разрушения Квазипериодические рентгеновские вспышки вновь связали с событиями приливного разрушения

Астрономы обнаружили девять квазипериодических рентгеновских вспышек

N+1
«Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках «Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках

Ирина Горбачева — о любимых фильмах, сковывающих амплуа и эзотерике

СНОБ
Фотоохота Фотоохота

Георгий Кардава — один из самых интересных и самобытных фотографов

Men Today
«Это все Агата»: атмосферный сериал Marvel о ведьмах-неудачницах «Это все Агата»: атмосферный сериал Marvel о ведьмах-неудачницах

Каким получился сериал «Это все Агата», словно созданный для осенних вечеров

Forbes
Как сумчатые подделали хищников Как сумчатые подделали хищников

В Южном полушарии у саблезубых кошек были крайне экзотические аналоги

Наука и Техника
Ихтиологическая филателия Ихтиологическая филателия

Завораживающая коллекция рыб на почтовых марках

Наука и жизнь
Не переношу критику Не переношу критику

Как научиться спокойно воспринимать замечания руководства

Лиза
Как найти своего мужчину и почему мы не тех выбираем Как найти своего мужчину и почему мы не тех выбираем

Не складывается личная жизнь? Возможно, ты сама создаешь препятствия

Лиза
Астрономы насчитали 55 убегающих звезд из сердца туманности Тарантул Астрономы насчитали 55 убегающих звезд из сердца туманности Тарантул

Астрономы провели перепись убегающих массивных звезд из скопления R136

N+1
Вечная мания завоеваний Вечная мания завоеваний

Александр Великий: «разорванный» портрет героя

Знание – сила
Необычайные приключения одной теории Необычайные приключения одной теории

Почему теория Дарвина не дает покоя стольким умам, профессиональным и досужим?

Знание – сила
Ещё один восстановленный Jeep 1975 года. На это раз от ICON Ещё один восстановленный Jeep 1975 года. На это раз от ICON

Последний шедевр ICON — восстановленный Jeep Cherokee

4x4 Club
Потолок золотой: как ограничение бюджетов в «Формуле-1» помогло заработать всем Потолок золотой: как ограничение бюджетов в «Формуле-1» помогло заработать всем

Как организаторам «Формулы-1» удалось вернуть к ней интерес

Forbes
Синдром внезапной гениальности: почему о нем не стоит мечтать? Синдром внезапной гениальности: почему о нем не стоит мечтать?

Синдром внезапной гениальности плохо изученное, но вполне реальное состояние

Psychologies
Открыть в приложении