Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

До 60-ти и старше До 60-ти и старше

Как до глубокой старости оставаться здоровыми, бодрыми и активными?

Лиза
«Я чувствую себя зомби»: россиянки объяснили, почему материнство сложнее офисной работы — 15 причин «Я чувствую себя зомби»: россиянки объяснили, почему материнство сложнее офисной работы — 15 причин

Главные трудности, с которыми сталкиваются многие матери

Psychologies
Цистит Цистит

Почему многих цистит настигает именно летом?

Здоровье
Как понять, что партнер «выключается» из отношений: 5 показательных признаков Как понять, что партнер «выключается» из отношений: 5 показательных признаков

Как понять, что партнер больше не видит в отношениях перспектив?

Psychologies
Кто такие деинфлюенсеры и почему они возненавидели дорогие фены, термокружки и тушь Кто такие деинфлюенсеры и почему они возненавидели дорогие фены, термокружки и тушь

Существует ли деинфлюенсинг в России и насколько это явление новое

Forbes
Как носить бижутерию, чтобы не выглядеть «дешево»: мнение стилиста Как носить бижутерию, чтобы не выглядеть «дешево»: мнение стилиста

Развенчиваем мифы: не только в ювелирных украшениях можно выглядеть дорого

VOICE
Как японский стартап GITAI готовится стать ключевым поставщиком роботов для NASA Как японский стартап GITAI готовится стать ключевым поставщиком роботов для NASA

GITAI — это компания, которая разрабатывает средства для использования в космосе

Forbes
Почему собранные ретейлерами на переработку вещи оказываются на свалках Африки Почему собранные ретейлерами на переработку вещи оказываются на свалках Африки

Почему в мире перерабатывается менее 1% текстильных отходов?

Forbes
Тоннельное мышление: почему мы искажаем реальность и как вернуть себе адекватность Тоннельное мышление: почему мы искажаем реальность и как вернуть себе адекватность

Сталкивались ли вы с людьми, которые убеждены, что только их картина мира верна?

Psychologies
Люди услышали тишину Люди услышали тишину

Как именно люди воспринимают тишину?

N+1
Фрагмент из книги Дениса Драгунского «Подлинная жизнь Дениса Кораблева» Фрагмент из книги Дениса Драгунского «Подлинная жизнь Дениса Кораблева»

Это больше, чем автобиография. Скорее, как признается, сам автор, это дневник

СНОБ
Что такое алкогольная депрессия и как распознать ее признаки Что такое алкогольная депрессия и как распознать ее признаки

Почему после обильного возлияния хочется умереть?

Maxim
«Бросить вызов голливудским ожиданиям»: как Флоренс Пью меняет образ женщины в кино «Бросить вызов голливудским ожиданиям»: как Флоренс Пью меняет образ женщины в кино

Как Флоренс Пью стала новым лицом феминизма в киноиндустрии.

Forbes
Заклинатели роботов: какие профессии создал ИИ и кто на этом зарабатывает Заклинатели роботов: какие профессии создал ИИ и кто на этом зарабатывает

Что за люди «работают на роботов» и какие навыки от них требуются?

Forbes
Кто такой Генри Форд и как ему удалось построить автомобильную империю Кто такой Генри Форд и как ему удалось построить автомобильную империю

Человек, который стал не только символом автомобилизации, но и изменил мир

РБК
Рассмеши меня, если сможешь: фильмы, где играют комики Рассмеши меня, если сможешь: фильмы, где играют комики

Комедии, байопик, оскароносная драма: фильмы, в которых играли комики

Правила жизни
Под ториевой аномалией на обратной стороны Луны заподозрили крупный гранитный массив Под ториевой аномалией на обратной стороны Луны заподозрили крупный гранитный массив

В районе ториевой аномалии на Луне располагается крупный гранитный массив

N+1
Birkin, корзинки, показы: главные модные моменты Джейн Биркин Birkin, корзинки, показы: главные модные моменты Джейн Биркин

Чем модная индустрия обязана Джейн Биркин?

Правила жизни
«Простоквашино», поехали! «Простоквашино», поехали!

Центры власти и стратегии выживания в одной нарисованной российской деревне

Weekend
Почувствуйте себя попаданцем: 7 захватывающих книг о других мирах Почувствуйте себя попаданцем: 7 захватывающих книг о других мирах

Семь книг, которые перенесут вас за миллионы километров, лет или галактик отсюда

ТехИнсайдер
Дети в парламенте: как женщины-политики совмещают материнство с работой Дети в парламенте: как женщины-политики совмещают материнство с работой

Как женщины-политики добиваются права не выбирать между работой и материнством

Forbes
Не будущее, а всегда существующее Не будущее, а всегда существующее

Яков Чернихов как единственный в СССР создатель архитектурного абсолюта

Weekend
Не только секретность: из чего состоит измена — 3 основных компонента Не только секретность: из чего состоит измена — 3 основных компонента

Универсальные маркеры и компоненты, которые, как правило, включает в себя измена

Psychologies
«Аббатство Даунтон»: Миллионные вложения, армия поклонников и похвала Елизаветы II «Аббатство Даунтон»: Миллионные вложения, армия поклонников и похвала Елизаветы II

Почему именно «Даунтон» завоевал сердца зрителей? Здесь нет ничего случайного

Караван историй
Вспоминая Джейн Биркин: какой была жизнь главной музы Сержа Генсбура и иконы стиля XX века Вспоминая Джейн Биркин: какой была жизнь главной музы Сержа Генсбура и иконы стиля XX века

Чем Джейн Биркин запомнилась зрителям и как вошла в историю моды

VOICE
Небесное создание Небесное создание

Техники борьбы с аэрофобией — на высоте

VOICE
Диджитализация романтики: как искусственный интеллект изменил знакомства и отношения Диджитализация романтики: как искусственный интеллект изменил знакомства и отношения

Как нейросети помогают тем, кто боится или не умеет знакомиться?

Forbes
Промежуточная еда: как перекусить с пользой для здоровья Промежуточная еда: как перекусить с пользой для здоровья

Вместе с экспертами отвечаем на вечный вопрос, что бы еще съесть, чтобы похудеть

Правила жизни
Hyundai Santa Fe 2024 выйдет с тремя рядами сидений и совершенно новым лицом Hyundai Santa Fe 2024 выйдет с тремя рядами сидений и совершенно новым лицом

Как будет выглядеть знакомый нам плюшевый Santa Fe?

4x4 Club
Алексей Нужный. Как научить смеяться Алексей Нужный. Как научить смеяться

История-признание о юморе, сложностях съемок сериалов и роли Бога в творчестве

Maxim
Открыть в приложении