Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Тренд на отказ от сахара: что будет с вашим телом через 30 дней sugar-free диеты Тренд на отказ от сахара: что будет с вашим телом через 30 дней sugar-free диеты

Смогли бы вы отказаться от шоколадки или любимого кофе с сиропом на 30 дней?

ТехИнсайдер
Ушедшее в народ Ушедшее в народ

Как сон мастера картонажа прославил духов Мексики?

Вокруг света
Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист

Чем опасны ИИ-модели для бизнеса и почему традиционная ИБ не справляется

Inc.
5 неожиданных технологий, которые изменили 3D-графику 5 неожиданных технологий, которые изменили 3D-графику

Какие технологии стояли у истоков современной 3D-графики

ТехИнсайдер
Какие позы любят девушки? 9 самых-самых (бонус: позиции, которые их бесят) Какие позы любят девушки? 9 самых-самых (бонус: позиции, которые их бесят)

Какие позы любят девушки? 9 самых-самых (бонус: позиции, которые их бесят)

Playboy
Тихоходкам набили татуировки электронным пучком Тихоходкам набили татуировки электронным пучком

Китайские материаловеды нанесли татуировки живым тихоходкам

N+1
Делать игры — это профессия: разработчик отвечает на (не)глупые вопросы Делать игры — это профессия: разработчик отвечает на (не)глупые вопросы

Правда, что в России не делают хороших игр? Как стать игровым разработчиком?

ТехИнсайдер
Эффект рататуя Эффект рататуя

Как вкусы из детства могут формировать наш характер и модель поведения

Grazia
В ритме сердца: что такое HRV и так ли он важен В ритме сердца: что такое HRV и так ли он важен

Разбираем все, что нужно знать о вариабельности сердечного ритма

РБК
Робопчелу научили садиться по-комарьи Робопчелу научили садиться по-комарьи

Инженеры разработали шасси для миниатюрного орнитоптера RoboBee

N+1
«Мои родственники защищали Москву»: Яна Сексте впервые снялась в фильме о войне «Мои родственники защищали Москву»: Яна Сексте впервые снялась в фильме о войне

Яна Сексте — о съемках в военной драме «В списках не значился»

VOICE
Как называют самцов мухи, божьей коровки и других животных Как называют самцов мухи, божьей коровки и других животных

Как называют самцов и самок разных животных?

Maxim
Мосты в голове Мосты в голове

Что такое ассоциации, как возникают, можно ли их поменять?

Grazia
3 сильные стороны интровертов, которые помогут им стать успешными 3 сильные стороны интровертов, которые помогут им стать успешными

Интроверты наделены множеством суперспособностей — нужно просто знать их

Inc.
Индейка на взлете Индейка на взлете

Российское производство мяса индейки выросло почти на 4%

Агроинвестор
От жуткого хоррора до ироничной пародии: как кино переосмысливает классические сказки на новый лад От жуткого хоррора до ироничной пародии: как кино переосмысливает классические сказки на новый лад

Оригинальные проекты, переосмысливающие классические сказки в неожиданном ключе

Правила жизни
Губернатор Московской области Андрей Воробьев: Нас часто сравнивают с нашей столицей Губернатор Московской области Андрей Воробьев: Нас часто сравнивают с нашей столицей

Глава Подмосковья об управлении регионом с помощью цифры и конкуренции с Москвой

Ведомости
Интенсивное лечение артериальной гипертензии снизило риск деменции Интенсивное лечение артериальной гипертензии снизило риск деменции

Интенсивное выявление артериальной гипертензии значительно снижает риск деменции

N+1
Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК

Каким играм с открытым миром стоит уделить время?

Maxim
Отложенный дефицит: чем чреват отказ нанимать джунов Отложенный дефицит: чем чреват отказ нанимать джунов

Почему отказ нанимать джунов — перспектива новой волны нехватки кадров

Forbes
Как сохранить близость с детьми, даже когда они становятся взрослыми Как сохранить близость с детьми, даже когда они становятся взрослыми

Если вы хотите, чтобы ваши дети всегда доверяли вам, следуйте этим советам

Inc.
Щедры на дивиденды Щедры на дивиденды

Какие компании в этом году поделятся прибылью с акционерами

Деньги
Бомбардировки, голод, штурм: как Калининград встречал конец войны Бомбардировки, голод, штурм: как Калининград встречал конец войны

Как принималось решение о том, что кенигсбергская земля отойдет Союзу

ФедералПресс
Минимум риска Минимум риска

5 финансовых рисков, которые случаются в жизни каждой женщины

Лиза
Денис Филиппов: Больших проблем на рынке жилья я бы не прогнозировал Денис Филиппов: Больших проблем на рынке жилья я бы не прогнозировал

Гендиректор фонда Дом.РФ — какие арендные проекты поддерживает государство

Ведомости
Японские ученые протестировали три способа пробуждения и выяснили, как избавиться от сонливости по утрам Японские ученые протестировали три способа пробуждения и выяснили, как избавиться от сонливости по утрам

Как изменение освещения в спальне поможет избавить от сонливости по утрам

Inc.
Собаки незаметно наносят ущерб окружающей среде Собаки незаметно наносят ущерб окружающей среде

Ваша собака очаровательна, но она представляет угрозу для окружающей среды

ТехИнсайдер
«Галилея археологов» «Галилея археологов»

Археологи давно борются с искушением перекопать поглубже всю Святую Землю

Знание – сила
Москва и коллекционеры Москва и коллекционеры

Москва в последние годы закрепила за собой статус главной площадки арт-рынка

Ведомости
Кругосветка за 72 дня и критика тюремной системы: о чем писали первые журналистки Кругосветка за 72 дня и критика тюремной системы: о чем писали первые журналистки

Шесть женщин, изменивших журналистику

Forbes
Открыть в приложении