ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

12 цитат 98-летнего долгожителя, которые помогут найти себя в жизни 12 цитат 98-летнего долгожителя, которые помогут найти себя в жизни

Мы же решили узнать у 98-летнего жителя, что он думает о счастье и смысле жизни

Psychologies
«Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях «Время жить»: мелодрама с Флоренс Пью о борьбе с болезнью и партнерских отношениях

«Время жить»: мелодрама, ставшая пособием по здоровым отношениям

Forbes
Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты

Почему вам нужно обязательно включить свеклу в свой рацион?

ТехИнсайдер
«Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны» «Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны»

В этом сентябре Центральный университет набрал абитуриентов на обучение

Деньги
Как проверить скорость SSD на запись и чтение Как проверить скорость SSD на запись и чтение

Программы для проверки скорости работы твердотельного накопителя

CHIP
Русский Зондервег? Или немецкий «особый путь»? Русский Зондервег? Или немецкий «особый путь»?

«Особый путь» (нем. Sonderweg) — понятие столь же русское, сколь и немецкое

Дилетант
Ставки сделаны Ставки сделаны

Уставший от войны народ жаждет зрелищ — и получает их сполна

Дилетант
Материнская смертность у японских макак оказалась ниже человеческой Материнская смертность у японских макак оказалась ниже человеческой

Средний уровень материнской смертности у макак не превышает и процента

N+1
Многоликий Ян Многоликий Ян

Ян Гинзбург: разархивирование настоящего

Weekend
Google показала, как квантовые компьютеры превзойдут мощнейшие суперкомпьютеры Google показала, как квантовые компьютеры превзойдут мощнейшие суперкомпьютеры

Почему шумоподавление это главное в разработке квантовых компьютеров

ТехИнсайдер
Дом для университета Дом для университета

История СПбГУ неразрывно связана со зданием Двенадцати коллегий

Санкт-Петербургский университет
Маша Трауб: Успех рождается из неравнодушия, а не из попытки угадать спрос Маша Трауб: Успех рождается из неравнодушия, а не из попытки угадать спрос

Маша Трауб — о том, как написать сказку, где танцуют макароны и котлеты

СНОБ
Доппельбоди-хоррор Доппельбоди-хоррор

«Другой человек»: проблема двойников в эпоху бодипозитива

Weekend
Что они несут Что они несут

Многие из образов киноперсонажей определяют моду на десятилетия вперед

Men Today
Все против всех Все против всех

Не пытка, а силовой допрос. Не война, а операция по поддержанию порядка…

Дилетант
Андрей Баранников: Сейчас нет «березок» и «балалаек» в национальной повестке, этот лубок остался позади Андрей Баранников: Сейчас нет «березок» и «балалаек» в национальной повестке, этот лубок остался позади

Что нельзя и что нужно доверять ИИ в сфере коммуникации

СНОБ
Держать удар: что такое «экванимити» и как бизнесмены ищут опору в невозмутимости Держать удар: что такое «экванимити» и как бизнесмены ищут опору в невозмутимости

Экванимити — умение сохранять внутреннее спокойствие и гармоничное состояние

Forbes
Девочки не умеют терпеть: что такое pain gap и почему женщины чаще испытывают боль Девочки не умеют терпеть: что такое pain gap и почему женщины чаще испытывают боль

Как стереотипы и недостаток знаний о женском теле делают нам больно

Forbes
Добытчица и домохозяин: как женщины рушат стереотип о том, кто должен содержать семью Добытчица и домохозяин: как женщины рушат стереотип о том, кто должен содержать семью

Provider woman: что это за тренд и как он влияет на традиционные устои общества?

Forbes
Образ жизни без кредита у организма Образ жизни без кредита у организма

Сеть клиник Biorise осваивает биохакинг

Монокль
«Не отрекаются любя»: 5 популярных ретропесен, в которых поется о нездоровых отношениях «Не отрекаются любя»: 5 популярных ретропесен, в которых поется о нездоровых отношениях

Далеко не все ретропесни имеют позитивный, с точки зрения психологии, посыл

Psychologies
Поры под контролем Поры под контролем

Как избавиться от расширенных пор?

Лиза
Семь причин мешков под глазами Семь причин мешков под глазами

Какие факторы способствуют появлению отеков под глазами

Здоровье
Марк. Мария Марк. Мария

Феномены-зумеры Мария Мацель и Марк Эйдельштейн в наступающей эре Водолея

Собака.ru
Бойтесь писем начальников: как социальную инженерию используют для взлома данных Бойтесь писем начальников: как социальную инженерию используют для взлома данных

Как компании могут защитить сотрудников и свою репутацию от взлома данных

Forbes
Один из тех, кто «состарил» университет Один из тех, кто «состарил» университет

Кем был Григорий Тишкин, увеличивший возраст СПбГУ почти на 100 лет

Санкт-Петербургский университет
Вторая жизнь моделей фораминифер Вторая жизнь моделей фораминифер

История идентификации старой музейной коллекции

Санкт-Петербургский университет
Яйцо Яйцо

Почему яйца называют чемпионами завтрака?

Здоровье
День апельсиновой битвы и праздник кур: самые необычные торжества разных народов мира День апельсиновой битвы и праздник кур: самые необычные торжества разных народов мира

Удивительные праздники со всех уголков мира

ТехИнсайдер
От стрелочных приборов до бортовых компьютеров: как развивалась авионика в самолетах От стрелочных приборов до бортовых компьютеров: как развивалась авионика в самолетах

Как менялись технологии авионики на протяжении веков

ТехИнсайдер
Открыть в приложении