Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что скрывает от нас подземка: 10 интересных фактов о московском метро Что скрывает от нас подземка: 10 интересных фактов о московском метро

Московское метро — незаменимый транспорт, про который мы не все знаем

ТехИнсайдер
Восток VS Запад Восток VS Запад

Сравним отношение к радостям жизни на Востоке и Западе!

Лиза
Дипфейк и верификация видео: как не стать жертвой обмана Дипфейк и верификация видео: как не стать жертвой обмана

Как обезопасить себя от дипфейков и мошеннических видео

Правила жизни
Многовековые развлечения: 5 лучших настольных игр Древнего мира Многовековые развлечения: 5 лучших настольных игр Древнего мира

Первые настолки появились еще в Древнем мире, а играли в них люди по всему свету

ТехИнсайдер
Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось

Ученые впервые назвали точную дату конца Вселенной

Inc.
Палены Палены

Потомки немецких рыцарей фон дер Палены находились на русской службе с XVIII в.

Дилетант
Маргарет Этвуд и Миучча Прада: женщины, которые вошли в рейтинг 50 Over 50 Forbes USA Маргарет Этвуд и Миучча Прада: женщины, которые вошли в рейтинг 50 Over 50 Forbes USA

Некоторые из тех, кто доказывает, что возраст — не помеха достижениям

Forbes
Бодрое утро Бодрое утро

8 завтраков, которые быстро разбудят организм

Лиза
Зерновые не стали доходнее Зерновые не стали доходнее

Итоги зерновой отрасли первой половины сезона 2024/25

Агроинвестор
Базальтовые бусины в невесомости подтвердили вклад трибоэлектричества в формирование планет Базальтовые бусины в невесомости подтвердили вклад трибоэлектричества в формирование планет

Зачем ученые отправили в суборбитальный полет кучку базальтовых бусин

N+1
Закупились отечественным Закупились отечественным

Госзакупки российских автомобилей выросли на 9% в 2024 г.

Ведомости
Иван Краско Иван Краско

Когда началась война, патриарху сцены Ивану Краско было 11...

Собака.ru
Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять

Травля: что раскручивает маховик агрессии и как его затормозить?

Psychologies
5 правил перезагрузки 5 правил перезагрузки

Как избавиться от лишних килограммов

Лиза
«Выигрывают только выносливые»: как работает финансовая стратегия FIRE «Выигрывают только выносливые»: как работает финансовая стратегия FIRE

Реально ли стать «пенсионером», пока ты еще достаточно молод?

Forbes
Как зарабатывать больше: 5 лайфхаков и 3 задания Как зарабатывать больше: 5 лайфхаков и 3 задания

Непросто найти человека, которого не волнует вопрос «Где взять больше денег?»

Psychologies
«Происхождение вкусов: Как любовь к еде сделала нас людьми» «Происхождение вкусов: Как любовь к еде сделала нас людьми»

Как мозг запоминает и классифицирует запахи

N+1
Михаил Мильчик Михаил Мильчик

Михаил Мильчик провел в Ленинграде первую, самую страшную, блокадную зиму

Собака.ru
Китайские кинематографисты: Российский кинорынок для нас очень важен Китайские кинематографисты: Российский кинорынок для нас очень важен

Джинг Ху и Диан Сонг — о том, почему Голливуд теряет свои позиции в Поднебесной?

Ведомости
Контролируя неравновесность Контролируя неравновесность

Программа для анализа CO₂ поможет в космосе и на Земле

Санкт-Петербургский университет
Папу в детскую! Папу в детскую!

Что делать, если твой муж все время пытается увильнуть от роли отца?

Лиза
Обеденная зона Обеденная зона

Пять ошибок, из-за которых тебе некомфортно за столом

Лиза
За мечтой — в кошелек? За мечтой — в кошелек?

«Анора» — философский фильм о мечтах и реальности

Монокль
«Отец врет, берет кредиты и тратит на себя, а мать „сохраняет семью“ и жертвует собой»: треугольник Карпмана в жизни «Отец врет, берет кредиты и тратит на себя, а мать „сохраняет семью“ и жертвует собой»: треугольник Карпмана в жизни

На чем держится семья, если в ней проявляется чистый треугольник Карпмана?

Psychologies
Утомленные школой Утомленные школой

Как облегчить жизнь ребенку в тяжелое для него время?

Лиза
11 лучших фильмов про блокаду Ленинграда 11 лучших фильмов про блокаду Ленинграда

Фильмы о том, как прервали самую страшную осаду в истории войн

Maxim
«История России языком дворянских гербов» «История России языком дворянских гербов»

Какое изображение можно считать гербом?

N+1
Как CJM помогает бизнесу нанимать сотрудников Как CJM помогает бизнесу нанимать сотрудников

Как CJM позволяет выявлять ключевые барьеры на пути соискателя к вакансии

Inc.
Трудности перевода Трудности перевода

Уже несколько лет верфи мира исследуют пути избавления от карбонового следа

Y Magazine
Как папа Карло Как папа Карло

Как химик-технолог и редактор Men's Health пришел к жизни, наполненной смыслом

Afternoon Seasons of life
Открыть в приложении