Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Анна Щербакова: «Своя дорога — та, что по душе» Анна Щербакова: «Своя дорога — та, что по душе»

Если не достиг желаемого результата, проблему нужно искать в себе

Караван историй
Деньги не играют: все тренеры «ПСЖ», которых увольняли катарские владельцы Деньги не играют: все тренеры «ПСЖ», которых увольняли катарские владельцы

Тренеры, которым не удалось сохранить работу в самом щедром клубе мира «ПСЖ»

Forbes
Сверчки спели хором Сверчки спели хором

Полевые сверчки изменяют свое ухаживающее поведение в присутствии конкурентов

N+1
Устал и ухожу: как владельцы и руководители компаний добровольно покидают свои посты Устал и ухожу: как владельцы и руководители компаний добровольно покидают свои посты

С годами отход от дел по болезни стал привычным для бизнеса

Forbes
Температура видеокарты: какой она должна быть, и как бороться с перегревом Температура видеокарты: какой она должна быть, и как бороться с перегревом

До какой предельной температуры может нагреваться видеокарта?

CHIP
На что похожа жизнь свободного человека и каким бывает детство в Репино На что похожа жизнь свободного человека и каким бывает детство в Репино

Сююмбике Давлет-Кильдеева — о радостях жизни на Финском заливе

РБК
Кто такие «профессионалы похудения» и почему им сложнее сбросить вес, чем остальным: мнение психолога Кто такие «профессионалы похудения» и почему им сложнее сбросить вес, чем остальным: мнение психолога

Отрывок из книги «Почему я не худею»

VOICE
Как установить облачные сервисы Google на Huawei Как установить облачные сервисы Google на Huawei

Как установить на Huawei Таблицы Google, а также Фото, Диск и Документы

CHIP
Почему яд скорпионов - одна из самых дорогих жидкостей на планете? Интересный факт! Почему яд скорпионов - одна из самых дорогих жидкостей на планете? Интересный факт!

Незначительное количество яда скорпиона может принести немалые деньги

ТехИнсайдер
Каким получился «Оппенгеймер» Кристофера Нолана — самый ожидаемый фильм года Каким получился «Оппенгеймер» Кристофера Нолана — самый ожидаемый фильм года

«Оппенгеймер» — кино о амбивалентной природе человечества

Правила жизни
«Отсюда выхода нет»: кто делает из наркоблогеров рок-звезд и почему людям интересно смотреть, как другие умирают? «Отсюда выхода нет»: кто делает из наркоблогеров рок-звезд и почему людям интересно смотреть, как другие умирают?

Кто такие наркоблогеры и насколько опасен их контент?

Psychologies
«Мною сильно манипулировали»: Кристина Асмус объяснила, почему не уходила от избивавшего ее мужчины «Мною сильно манипулировали»: Кристина Асмус объяснила, почему не уходила от избивавшего ее мужчины

Актрису возмутили предположения о том, что она сама виновата в домашнем насилии

VOICE
Лучшие платформеры на ПК: топ-10 проектов в 2023 году Лучшие платформеры на ПК: топ-10 проектов в 2023 году

10 лучших игр-платформеров в 2023 году на ПК

CHIP
Сетевой маркетинг: как спортсмены NCAA зарабатывают миллионы, оставаясь любителями Сетевой маркетинг: как спортсмены NCAA зарабатывают миллионы, оставаясь любителями

Как студенты-спортсмены зарабатывают миллионы

Forbes
«Делирий», глава из бестселлера британского нейробиолога Анила Сета «Быть собой: Новая теория сознания» «Делирий», глава из бестселлера британского нейробиолога Анила Сета «Быть собой: Новая теория сознания»

Профессор нейробиологии Анил Сет приоткрывает окно внутрь нашего сознания

Правила жизни
Мозг «кладет поближе» те воспоминания, которые считает важными для обобщений Мозг «кладет поближе» те воспоминания, которые считает важными для обобщений

Воспоминания перемещаются из гиппокампа в кору головного мозга

ТехИнсайдер
Мал да удал: у сенокосцев обнаружили три вида самцов с уникальной стратегией размножения Мал да удал: у сенокосцев обнаружили три вида самцов с уникальной стратегией размножения

У редкого вида паукообразных существует три разных типа самцов

ТехИнсайдер
Без лишних затрат: как сделать когтеточку для кота своими руками Без лишних затрат: как сделать когтеточку для кота своими руками

Как сделать когтеточку с минимальными тратами?

ТехИнсайдер
Ягоды и грибы: где и как правильно собирать. Советы эксперта Ягоды и грибы: где и как правильно собирать. Советы эксперта

Где и когда искать грибы и ягоды, что взять с собой и как одеться

РБК
Отрывок из книги «Алексей Щусев: Архитектор № 1» писателя и историка Александра Васькина Отрывок из книги «Алексей Щусев: Архитектор № 1» писателя и историка Александра Васькина

Глава из книги Александра Васькина «Алексей Щусев: Архитектор № 1»

СНОБ
Видео с полицейским снизило риск неосторожного обращения с оружием среди детей Видео с полицейским снизило риск неосторожного обращения с оружием среди детей

Инструктаж снижает риск неосторожного обращения с оружием у детей

N+1
«Динозавры России: Прошлое, настоящее, будущее» «Динозавры России: Прошлое, настоящее, будущее»

Книга о русских динозаврах и о тех, кто их изучает

N+1
Без денег не останетесь: куда прятать наличные на пляже Без денег не останетесь: куда прятать наличные на пляже

Самые надежные места, куда можно спрятать деньги во время отдыха на море

ТехИнсайдер
Развитие на уровне мемов: российский бизнес — о настоящем и будущем нейросетей Развитие на уровне мемов: российский бизнес — о настоящем и будущем нейросетей

Как искусственный интеллект изменит рынок труда и кто лишится работы?

Forbes
8 идей, как повторно использовать старые контейнеры для контактных линз – всем путешественникам на заметку! 8 идей, как повторно использовать старые контейнеры для контактных линз – всем путешественникам на заметку!

Контейнеры для линз — незаменимая вещь для путешественника

ТехИнсайдер
80 процентов детских смертей в Африке и Южной Азии оказались предотвратимы 80 процентов детских смертей в Африке и Южной Азии оказались предотвратимы

82,3% смертей детей в Африке и Южной Азии эксперты признали предотвратимыми

N+1
Свиньи помогли сородичам выбраться из заточения Свиньи помогли сородичам выбраться из заточения

Почему свиньи помогают друг другу?

N+1
Пыльцевые отпечатки истории Пыльцевые отпечатки истории

Палинологический анализ — мощный инструмент в руках реконструкторов

Наука и жизнь
Глобальное потепление радикально меняет средиземноморский туризм Глобальное потепление радикально меняет средиземноморский туризм

Может ли изменение климата в конечном итоге изменить туризм?

ТехИнсайдер
Роботы и люди: как производят материнские платы на заводе в Шуе Роботы и люди: как производят материнские платы на заводе в Шуе

Как устроен завод по изготовлению материнских плат

СНОБ
Открыть в приложении