Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Разговор на кухне Разговор на кухне

О самых свежих трендах в организации кухонных пространств

SALON-Interior
Как начать знакомство с постклассической музыкой Как начать знакомство с постклассической музыкой

Пианист Дмитрий Селипанов о том, как полюбить неоклассику

GQ
5 дизайнерских отелей, в которых хочется побывать после карантина 5 дизайнерских отелей, в которых хочется побывать после карантина

Пять отелей, где настроение определяет дизайн пространства

РБК
Фогель: «Я не из тех артистов, кто готов хайпить на теме изоляции» Фогель: «Я не из тех артистов, кто готов хайпить на теме изоляции»

Интервью с новичком в рэп-игре Фогелем

Cosmopolitan
Одна вокруг света в карантин. Отель трехуровневой защиты и вооруженный конвой в Пакистане Одна вокруг света в карантин. Отель трехуровневой защиты и вооруженный конвой в Пакистане

70-я серия о кругосветном путешествии москвички Ирины Сидоренко

Forbes
Апсайклинг по-королевски: как английский бренд By Walid создает одежду из тканей XIX века Апсайклинг по-королевски: как английский бренд By Walid создает одежду из тканей XIX века

Бренд By Walid должен заинтересовать любого коллекционера нетривиальных вещей

GQ
Почти леди. Норман Мейлер о Мадонне (отрывок из интервью) Почти леди. Норман Мейлер о Мадонне (отрывок из интервью)

Разговор с Мадонной о славе, одиночестве, контрацепции, порно и религии

Esquire
Пища богов Пища богов

В Греции есть всё. Во всяком случае, всё, что нужно для хорошего застолья точно!

Лиза
Гендерные стереотипы не повлияли на доверие к роботам Гендерные стереотипы не повлияли на доверие к роботам

Чтобы не поддерживать стереотипы, стоит создавать гендерно-нейтральных роботов

N+1
«Бежишь за ним, а у него есть код». В пропусках обнаружили ошибки «Бежишь за ним, а у него есть код». В пропусках обнаружили ошибки

Об ошибках в приложении «Карантин» рассказали сотрудники ГИБДД

РБК

10 самых экзотичных переложений европейских фильмов в Голливуде

Esquire
От Кегресса до От Кегресса до

Примеры, которые позволяют с гордостью говорить о машинах нашей страны

Популярная механика
Вам стоит обратить внимание на бойца Петра Яна Вам стоит обратить внимание на бойца Петра Яна

Россиянин Петр Ян – сильный игрок в UFC

GQ
Как индустрия киберспорта переживает период самоизоляции Как индустрия киберспорта переживает период самоизоляции

Как развиваются виртуальные соревнования и почему не стоит их игнорировать

GQ
Кавер-дуэт Queens: о стабильно «взрывных» песнях на любых корпоративах и раскрепощенных бюджетниках Кавер-дуэт Queens: о стабильно «взрывных» песнях на любых корпоративах и раскрепощенных бюджетниках

Интервью с солистками @girlsband.ru Татьяной и Анастасией

Playboy
Химики остановили миграцию ионов в перовските Химики остановили миграцию ионов в перовските

Химикам удалось получить двумерную пленку из двух разных материалов

N+1
Самые дорогие мужские вещи, проданные на аукционе Самые дорогие мужские вещи, проданные на аукционе

Неплохой получился бы гардероб, если бы все это вошло в одну коллекцию

GQ
Самый некрасивый во дворе — фиаско последнего большого «Форда» Самый некрасивый во дворе — фиаско последнего большого «Форда»

Жаба, гаргулья, чудовище — это лишь несколько прозвищ несчастного Scorpio.

Maxim
Fiat 124 vs ВАЗ-2101: копия лучше оригинала Fiat 124 vs ВАЗ-2101: копия лучше оригинала

Многие называли “Жигули” копией Fiat 124

Популярная механика
Сверхтяжёлый трофей: танк, ни разу не вступивший в бой Сверхтяжёлый трофей: танк, ни разу не вступивший в бой

Немецкий танк Pz.Kpfw. Maus оставил заметный след в истории танкостроения

Популярная механика
Зилс спасения Зилс спасения

Фантасмагорический рассказ Павла Пепперштейна

Vogue
Предсказан новый тип галактик Предсказан новый тип галактик

Ученые поняли, почему крошечной галактике так трудно омолодиться

Популярная механика
Создана вибрирующая одежда, изменяющая сознание: игры с восприятием Создана вибрирующая одежда, изменяющая сознание: игры с восприятием

Исследователи разработали вибрирующий текстиль, который изменяет восприятие

Популярная механика
Потепление позволит зеленым водорослям продвинуться вглубь Антарктиды Потепление позволит зеленым водорослям продвинуться вглубь Антарктиды

На Антарктическом полуострове водоросли занимают почти два квадратных километра

N+1
Да пребудет с тобой Четвёртое мая! 17 неожиданных фактов о саге Да пребудет с тобой Четвёртое мая! 17 неожиданных фактов о саге

4 мая - особенный день для поклонников саги “Звездные войны”

Cosmopolitan
Война без особых причин Война без особых причин

Киберспорт гораздо раньше, чем ожидалось, становится главным в нашем мире

GQ
Вооруженный иконостас: как РПЦ удивила Россию Путиным и Сталиным Вооруженный иконостас: как РПЦ удивила Россию Путиным и Сталиным

Новости о главном храме вооруженных сил уже неделю уверенно держаться в топе

Forbes
Революция уже в пути. Или нет, возможно Революция уже в пути. Или нет, возможно

Отношение к покупкам в интернете останется непредсказуемым

VC.RU
«Брэду Питту мы уже написали»: как инстаграм «Сказки на дому» за месяц превратился в международный проект с инвесторами «Брэду Питту мы уже написали»: как инстаграм «Сказки на дому» за месяц превратился в международный проект с инвесторами

Создатель «Сказки на дому» — о том, как искал команду, деньги и чтецов

Forbes
10 лучших фильмов — обладателей «Золотой пальмовой ветви» 10 лучших фильмов — обладателей «Золотой пальмовой ветви»

Субъективный список победителей Канн за всю историю кинофестиваля

Esquire
Открыть в приложении