Ученые проверили надежность ответов, которые дают генеративные поисковые системы

ТехИнсайдерHi-Tech

Проверяйте ответы ChatGPT: его надежность пока на низком уровне

Владимир Губайловский

85c3bc8f65f53d9d658df938d7439b17_ce_1920x1280x0x0.jpg
Public Domain

ChatGPT, кажется, уже повсюду. Его используют программисты, веб-дизайнеры, писатели, музыканты, переводчики и многочисленные компании всех видов деятельности. Но он ошибается! И к тому же «умело» маскирует ошибки. Нужно быть аккуратным.

Ученые Стэнфордского университета проверили надежность ответов, которые дают генеративные поисковые системы, в том числе ChatGPT. Выводы ученые довольно тревожные. Чат-боты отвечают гладко, но за "фасадом достоверности", прячутся многочисленные ошибки: только около половины предложений были полностью подкреплены цитатами, а четверть цитат не имели надежных ссылок.

ChatGPT доступен для общего пользования всего полгода, но у него более 100 миллионов пользователей по всему миру. Он является самым быстро растущим приложением в истории и обрабатывает более 10 миллионов запросов в день. Практически ежедневно мы слышим, что он способен перевернуть все - от бизнес-моделей до личных привычек.

Но некоторые исследователи высказывают серьезные опасения по поводу ChatGPT. Наиболее заметным стало письмо, подписанное в марте более чем 1000 экспертов, в котором они призывали ввести мораторий на расширение технологии ИИ до тех пор, пока ее риски и опасности не будут лучше изучены.

Скептики в основном сосредоточены на возможности манипулирования ИИ во вредоносных целях или описывают возможные сценарии, в которых модели ИИ самостоятельно предпринимают злонамеренные действия. Другие ученые сосредоточены на более насущной проблеме: точности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пальцы сморщиваются одинаково каждый раз, когда вы долго находитесь в воде Пальцы сморщиваются одинаково каждый раз, когда вы долго находитесь в воде

Как исследование показало, что морщины на коже пальцев остаются неизменными

ТехИнсайдер
Нейросеть от Meta узнает 4017 языков по устной речи и ответит на 1107 из них Нейросеть от Meta узнает 4017 языков по устной речи и ответит на 1107 из них

Компания Meta выпустила языковую модель, которая понимает устную речь

N+1
IT-разработка «внутри» или готовое решение: что выбрать IT-разработка «внутри» или готовое решение: что выбрать

Стоит ли IT-компании разрабатывать ПО с нуля или лучше купить готовое решение?

Inc.
Британские ученые выяснили: по каким формулам изучать искусство Ренессанса Британские ученые выяснили: по каким формулам изучать искусство Ренессанса

Издательство Ad Marginem выпускают коллекцию книг, посвященных искусству

Forbes
Как заснуть буквально за минуту: способ, который все мы бессознательно используем Как заснуть буквально за минуту: способ, который все мы бессознательно используем

Как помочь своему организму заснуть?

Maxim
Как долго может прожить курица без головы? И почему с человеком этот трюк не пройдет? Как долго может прожить курица без головы? И почему с человеком этот трюк не пройдет?

История обезглавленного петуха Майка, который поставил мировой рекорд! Но как?

ТехИнсайдер
Вставай с дивана! Гиподинамия: причины малоподвижного образа жизни и его последствия Вставай с дивана! Гиподинамия: причины малоподвижного образа жизни и его последствия

Аристотель сказал: «Движение – это жизнь, а жизнь – это движение!»

Лиза
Институт благородных девиц: зачем нужны школы с раздельным обучением Институт благородных девиц: зачем нужны школы с раздельным обучением

Разбираемся во всех «за» и «против» по поводу раздельного обучения в школах

Forbes
Палеонтологи подтвердили существование муста у мамонтов Палеонтологи подтвердили существование муста у мамонтов

Самцы мамонтов, как и современные слоны, были способны испытывать муст

N+1
Иван Добронравов: «Я рад, что в моем окружении немало людей, которые могут сказать неприятную правду» Иван Добронравов: «Я рад, что в моем окружении немало людей, которые могут сказать неприятную правду»

Иван Добронравов рассказал о сложностях съемок в сериале «Вика-ураган»

VOICE
Иные миры Иные миры

Инопланетные пейзажи на Земле

Men Today
«Оля хайпилась на разводе, меня хотели заснять с любовницей»: Дмитрий Тарасов рассказал, как ушел от Бузовой «Оля хайпилась на разводе, меня хотели заснять с любовницей»: Дмитрий Тарасов рассказал, как ушел от Бузовой

Дмитрий Тарасов заверил, что не изменял Ольге Бузовой с нынешней супругой

VOICE
Клопы-убийцы из Австралии покрывают тело липкой смолой, чтобы их жертва не смогла сбежать Клопы-убийцы из Австралии покрывают тело липкой смолой, чтобы их жертва не смогла сбежать

Клопы-убийцы используют смертоносный инструмент для убийства своих жертв

ТехИнсайдер
10 самых провальных российских фильмов XXI века 10 самых провальных российских фильмов XXI века

Про половину из этих убыточных кинолент вы даже не слышали

Maxim
Таксистов попросили оставить без второй страховки. Почему это важно Таксистов попросили оставить без второй страховки. Почему это важно

О поправках введения дополнительного страхового полиса для таксистов

РБК
Phoenix: амбициозный проект Phoenix: амбициозный проект

Проект Phoenix основан на аккуратном «пилотируемом» подходе к обучению

ТехИнсайдер
Алексей Иорш Алексей Иорш

Алексей Иорш занимается живописью, графикой, стрит-артом и поднимает важные темы

Правила жизни
Почему снижение популяции людей на Земле — это хорошо? Мнение эксперта Почему снижение популяции людей на Земле — это хорошо? Мнение эксперта

Будущее с меньшим количеством людей предлагает больше возможностей

ТехИнсайдер
Связанные одной цепью Связанные одной цепью

Большинство людей, которые курят, уверены, что это помогает им не толстеть

Здоровье
На одном денье сидели: король, королева На одном денье сидели: король, королева

Что средневековая монета говорит об отношениях Карла Великого со своей женой

N+1
Секрет скорости: как гепарду удается бегать так быстро? Секрет скорости: как гепарду удается бегать так быстро?

Как гепарду удается развивать скорость свыше 100 км/ч?

ТехИнсайдер
«Я играю стерву. Любите ее и ненавидьте!»: Мария Горбань раскрыла секреты сериала «Звездный суд» «Я играю стерву. Любите ее и ненавидьте!»: Мария Горбань раскрыла секреты сериала «Звездный суд»

Мария Горбань сыграла вместе с Максимом Лагашкиным в комедийном сериале

VOICE
Вдумчивый, тревожный, сдержанный: какой вы интроверт? Вдумчивый, тревожный, сдержанный: какой вы интроверт?

Наши представления об интровертах нуждаются в пересмотре, считают психологи

Psychologies
Рак, разводы и изнасилования: страшные судьбы актрис из сериала Рак, разводы и изнасилования: страшные судьбы актрис из сериала

Как сложились жизни актрис из "Зачарованных", и как они выглядят сейчас?

VOICE
«Маме виднее»: как американка зарабатывает $100 млн на детской смеси «Маме виднее»: как американка зарабатывает $100 млн на детской смеси

Как бренд Bobbie смог добиться огромного спроса на свою продукцию?

Forbes
В древнеримских некрополях Бейрута нашли останки мигрантов В древнеримских некрополях Бейрута нашли останки мигрантов

Биоархеологи провели анализ костей и зубов, раскопанных в некрополях Бейрута

N+1
Редкие кенгуровые крысы вернулись на австралийский полуостров Йорк впервые за сто лет Редкие кенгуровые крысы вернулись на австралийский полуостров Йорк впервые за сто лет

Кистехвостые беттонги почти исчезли в Австралии, но обещали вернуться

N+1
Чтобы работал как часы: 5 напитков, которые любит твой кишечник Чтобы работал как часы: 5 напитков, которые любит твой кишечник

Эти вкусные, полезные и доступные напитки день за днем улучшают твой микробиом

VOICE
Передать нельзя оставить: чем NASA обидело команду New Horizons Передать нельзя оставить: чем NASA обидело команду New Horizons

Почему одни хотят перейти к гелиофизике, а другие не готовы бросать пояс Койпера

N+1
Эспрессо на мелком помоле оказался невкусным из-за положительной обратной связи Эспрессо на мелком помоле оказался невкусным из-за положительной обратной связи

Почему при слишком мелком помоле эспрессо получается невкусным?

N+1
Открыть в приложении