ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Погрузиться в сон Погрузиться в сон

Как научиться высыпаться, не меняя привычного ритма жизни

Лиза
Африканская пропасть Африканская пропасть

Англо-бурская война как историческая неизбежность

Знание – сила
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Нефтяные качели Нефтяные качели

Что происходит с ценой на углеводороды

Деньги
Мозг в декрете: как беременность влияет на память, эмпатию и интеллект женщин Мозг в декрете: как беременность влияет на память, эмпатию и интеллект женщин

Меняется ли мозг беременных в период родительства и подготовки к нему?

Forbes
Что делать, если вы постоянно ссоритесь: 6 советов клинического психолога Что делать, если вы постоянно ссоритесь: 6 советов клинического психолога

Эти очевидные советы могут спасти ваши отношения

Psychologies
«Я хочу построить наследие»: роман о рабыне, которая стала предпринимательницей «Я хочу построить наследие»: роман о рабыне, которая стала предпринимательницей

Отрывок из романа Ванессы Райли «Королева острова»

Forbes
«Мораль. О восстановлении общего блага в эпоху разобщенности» «Мораль. О восстановлении общего блага в эпоху разобщенности»

Чем опасны одиночество и социальная изоляция

N+1
«Кровавый зуб» «Кровавый зуб»

...Из-под ног вспорхнули рябчики. Кто-то удивлённо спросил: «Это что, кровь?»

Наука и жизнь
Дождь со снегом Дождь со снегом

Автомобили в объективе фотографа Бориса Косарева

Автопилот
Ярославль Ярославль

Что должно быть в вишлисте туриста, решившего посетить Ярославль?

КАНТРИ Русская азбука
Скрытая угроза Скрытая угроза

Как распознать финансовый абьюз и защититься от него

Лиза
25 оттенков горечи 25 оттенков горечи

Как воспринимается горечь: в желудке, мозге, сердце и даже мочеполовой системе?

Наука и жизнь
Простая техника соблюдения диеты, которая продлит жизнь на несколько лет. И это лучше популярного голодания! Простая техника соблюдения диеты, которая продлит жизнь на несколько лет. И это лучше популярного голодания!

Лучший способ продлить свою жизнь — сократить потребление калорий

ТехИнсайдер
Несбыточная «четверка» Несбыточная «четверка»

Почему неадекватный таргет по инфляции является реальной проблемой

Монокль
«Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках «Я клоун по жизни». Актриса Ирина Горбачева о «Храбром сердце», продюсерском кино и духовных практиках

Ирина Горбачева — о любимых фильмах, сковывающих амплуа и эзотерике

СНОБ
6 признаков того, что у вас эмоционально незрелые родители 6 признаков того, что у вас эмоционально незрелые родители

Кто такие эмоционально незрелые родители?

Psychologies
«Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях «Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях

«Время жить»: мелодрама, ставшая пособием по здоровым отношениям

Forbes
«История двух сестер»: что нужно знать про корейского режиссера Ким Джиуна «История двух сестер»: что нужно знать про корейского режиссера Ким Джиуна

Фильм Ким Джиуна оказал огромное влияние на корейский кинематограф

СНОБ
Страшное слово ОАС Страшное слово ОАС

Аббревиатура ОАС в начале 1960-х наводила ужас на всю Францию

Дилетант
Для аптечки, уборки и защиты от насекомых: химик назвал самые полезные эфирные масла Для аптечки, уборки и защиты от насекомых: химик назвал самые полезные эфирные масла

Как с помощью эфирных масел снять стресс после долгого дня и укрепить иммунитет

ТехИнсайдер
Эдуард Артемьев Эдуард Артемьев

Правила жизни композитора Эдуарда Артемьева

Правила жизни
Лагерные бараки, бандитская любовь и потомственная печница — какое кино показали на фестивале «Маяк» Лагерные бараки, бандитская любовь и потомственная печница — какое кино показали на фестивале «Маяк»

Фильмы «Маяка», которые точно стоит увидеть

СНОБ
Сочувствие господину Пингвину Сочувствие господину Пингвину

«Пингвин»: комикс, снятый по правилам Нового Голливуда

Weekend
Что происходит в мозге человека, когда он смотрит на шедевр Вермеера Что происходит в мозге человека, когда он смотрит на шедевр Вермеера

Ученые измерили реакцию мозга при просмотре картины Йоханнеса Вермеера

ТехИнсайдер
Как японский секонд-хенд завоевывает мир и помогает стране пережить инфляцию Как японский секонд-хенд завоевывает мир и помогает стране пережить инфляцию

Что, кому и за сколько продают секонд-хенды и почему в Японии их так много

Forbes
По следам ушедшей эпохи По следам ушедшей эпохи

Реконструкция уникальной исторической квартиры в стиле ар-нуво

SALON-Interior
«Для IPO рынок сейчас слишком спекулятивный» «Для IPO рынок сейчас слишком спекулятивный»

О том, как криптовалюты отбирают аудиторию у классических брокеров

Монокль
Историк о диалоге как пути мировой культуры Историк о диалоге как пути мировой культуры

Какую роль играет умение обращать свои мысли к собеседнику?

РБК
Цифровой рубль — это просто Цифровой рубль — это просто

Как мы будем пользоваться новой формой национальной валюты

Монокль
Открыть в приложении