Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Фундамент» города будущего: ключевые тренды и подходы к проектированию | The “Foundation” of the City of the Future: Key Trends and Design Approaches «Фундамент» города будущего: ключевые тренды и подходы к проектированию | The “Foundation” of the City of the Future: Key Trends and Design Approaches

Какими могут быть подходы к разработке концепций Города будущего?

Позитивные изменения
Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов

О том, как гражданское общество в России строит систему сокращения отходов

Forbes
7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться 7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться

Что такое законы психологии и как правильно их применять

VOICE
Стоят ли дорогие фены своих денег: мнение парикмахеров Стоят ли дорогие фены своих денег: мнение парикмахеров

Нужен ли тебе фен за тридцать три, а не за три тысячи рублей? Давай разбираться!

VOICE
Корней Чуковский Корней Чуковский

Корней Чуковский — литературный гений, полный противоречий

Дилетант
Новости науки Новости науки

Обнаруженная в ранней Вселенной грандиозная галактика и другие новости науки

Знание – сила
Войны сыновей Войны сыновей

Как потомки Вильгельма I делили его наследие

Дилетант
Денис Шевченко Денис Шевченко

Сентиментальный твист и «Новая Академия» в квартире Дениса Шевченко

Собака.ru
Блестящая инвестиция Блестящая инвестиция

Как грамотно вложиться в золото

Деньги
Биология на рубеже веков, или Сто лет тому вперед Биология на рубеже веков, или Сто лет тому вперед

Биология в 1900-х годах по темпам своего развития ничуть не отставала от физики

Знание – сила
Мосты в голове Мосты в голове

Что такое ассоциации, как возникают, можно ли их поменять?

Grazia
Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года

Как выбрать аккумуляторный кусторез для сада?

CHIP
Возраст отдельных изображений Альтамиры оценили более чем в 20-30 тысяч лет Возраст отдельных изображений Альтамиры оценили более чем в 20-30 тысяч лет

Рисунки в пещере Альтамира могут иметь возраст в 20-30 тысяч лет

N+1
Из Москвы в Питер на деньги синдиката Из Москвы в Питер на деньги синдиката

Как устроен механизм финансирования ВСМ Москва — Санкт-Петербург

Монокль
Распоследний магнат Распоследний магнат

«Киностудия» — самопародия голливудских остряков на киноиндустрию

Weekend
Лестница в небо Лестница в небо

Как помочь новому поколению найти свое место в нашем безумном мире

Men Today
Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования

Государство хочет установить правила регулирования работы маркетплейсов

Forbes
Древние города Древние города

Что посмотреть в поселениях России, которым более тысячи лет

Лиза
Аграрный PR как часть стратегии развития компании Аграрный PR как часть стратегии развития компании

Какие эффективные инструменты маркетинговых коммуникаций используют в 2025 году

Агроинвестор
Вячеслав Богдан: «Бизнес – это искусство вовремя отпускать» Вячеслав Богдан: «Бизнес – это искусство вовремя отпускать»

Спорт всегда был важной частью жизни сооснователя Flowwow Вячеслава Богдана

Ведомости
Изобретая наследие Изобретая наследие

Как экономика впечатлений меняет российские города

Эксперт
Светлана Коркошко: «Одиночество — это моя природа» Светлана Коркошко: «Одиночество — это моя природа»

«Я долго не могла переступить порог моего любимого МХАТа после его раздела»

Коллекция. Караван историй
Бренд народного происхождения Бренд народного происхождения

Как в России развиваются художественные промыслы

Эксперт
«Сейчас период повышения внутренней эффективности» «Сейчас период повышения внутренней эффективности»

Дмитрий Фосман — о перспективах развития экспорта и работе по привлечению кадров

Агроинвестор
Лошади стали прекрасными бегунами из-за генетической ошибки Лошади стали прекрасными бегунами из-за генетической ошибки

Мутация, из-за которой лошади должны были вымереть, но стали отличными бегунами

ТехИнсайдер
Созданы в России Созданы в России

Доля семян российской селекции в посевах приблизилась к 68%

Агроинвестор
Язык и окружающая среда: почему у одних народов больше слов для обозначения любви, а у других – для снега Язык и окружающая среда: почему у одних народов больше слов для обозначения любви, а у других – для снега

Как окружающая среда влияет на словарный запас?

ТехИнсайдер
Бестужевы (Бестужевы-Рюмины) Бестужевы (Бестужевы-Рюмины)

Бестужевы — род с таинственным происхождением и запутанной генеалогией

Дилетант
Я вас люблю Я вас люблю

Стоит ли признаваться в любви первой?

Лиза
Есть, чтобы жить Есть, чтобы жить

Люди в три раза меньше болели бы раком, если бы только правильно питались

Лиза
Открыть в приложении