Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Антифашисты в немецких мундирах Антифашисты в немецких мундирах

Заговор против Гитлера окончился двойной неудачей

Дилетант
10 привычек для тех, кто хочет жить долго 10 привычек для тех, кто хочет жить долго

Долголетие - это просто!

Cosmopolitan
10 причин не любить Джима Джармуша 10 причин не любить Джима Джармуша

Следуя заповеди «Не сотвори себе кумира», узнаем Джима Джармуша поближе

Esquire
Крылья победы: где купить военный самолёт времён ВОВ Крылья победы: где купить военный самолёт времён ВОВ

В предвоенные и военные годы в СССР было выпущено 110 000 военных самолетов

Популярная механика
Да пребудет с тобой Четвёртое мая! 17 неожиданных фактов о саге Да пребудет с тобой Четвёртое мая! 17 неожиданных фактов о саге

4 мая - особенный день для поклонников саги “Звездные войны”

Cosmopolitan
Соленую воду на Марсе посчитали непригодной для жизни Соленую воду на Марсе посчитали непригодной для жизни

Поверхность Марса и его недра не подходят для существования живых организмов

N+1
10 самолётов, сделанных в самых неожиданных странах 10 самолётов, сделанных в самых неожиданных странах

Есть страны, которые совершенно не ассоциируются с авиастроением

Популярная механика
Почему нам так трудно вычислять лжецов Почему нам так трудно вычислять лжецов

Многие думают, что вполне способны отличить правду от лжи

Psychologies
Кайф и трепет в кондитерском искусстве Кайф и трепет в кондитерском искусстве

Валерия Сидорова — шеф-кондитер ресторана White Rabbit

Bones
Инопланетяне, где вы? Одни ли мы во Вселенной Инопланетяне, где вы? Одни ли мы во Вселенной

Повезло ли кому-нибудь во Вселенной так же, как и нам?

Популярная механика
Полет на высоте: истории, рассказанные стюардессами и пилотами Полет на высоте: истории, рассказанные стюардессами и пилотами

Самые интересные истории о том, что происходит на борту самолета

Esquire
Как распознать проплаченные отзывы в интернет-магазинах Как распознать проплаченные отзывы в интернет-магазинах

Как отличить фейковые отзывы от мнения реальных пользователей

CHIP
Пересадка бороды: 6 ответов на главные вопросы Пересадка бороды: 6 ответов на главные вопросы

Рассказываем обо всех тонкостях пересадки бороды

Playboy
Быстрый радиовсплеск объяснили падением астероида на пульсар Быстрый радиовсплеск объяснили падением астероида на пульсар

Модель позволяет объяснить наблюдаемые необычные сигналы в космосе

N+1
Гигантские искусственные атомы обменялись возбуждениями через волновод Гигантские искусственные атомы обменялись возбуждениями через волновод

Из сверхпроводящих кубитов можно создать два гигантских искусственных атома

N+1
Игровое пространство Игровое пространство

Бюджеты, зарплаты, призовые и трансферы киберспорта

Forbes
Не сможешь оторваться! Сериалы про подростков для тех, кому понравилась Не сможешь оторваться! Сериалы про подростков для тех, кому понравилась

Подборка лучших сериалов о непростой жизни подростков

Cosmopolitan
Что на самом деле нужно успеть сделать в самоизоляции Что на самом деле нужно успеть сделать в самоизоляции

Во многих регионах страны продолжается режим самоизоляции

РБК
Твой личный шедевр Твой личный шедевр

Микротатуировки: за и против

Cosmopolitan
Джордж Оруэлл Джордж Оруэлл

Правила жизни Джорджа Оруэлла

Esquire
Моисей и все-все-все! Кто такие евреи и почему о них все время говорят? Моисей и все-все-все! Кто такие евреи и почему о них все время говорят?

Разбираемся в том, почему еврейский вопрос всегда актуален

Maxim
Тяжелее, когда легче: неочевидные последствия похудения Тяжелее, когда легче: неочевидные последствия похудения

Какие трудности могут возникнуть после достижения желанного результата

Psychologies
Тяжелая вода оказалась сладкой Тяжелая вода оказалась сладкой

Биохимики подтвердили сладкий вкус тяжелой воды

N+1
«Мечта Билла Гейтса»: суперяхта на водороде «Мечта Билла Гейтса»: суперяхта на водороде

Билл Гейтс собирается построить 112-метровую суперяхту за 700 миллионов долларов

Популярная механика
Человеческий фактор Человеческий фактор

Большие модные Дома все чаще поддерживают камерные мастерские

Vogue
Литовская кольцевая Литовская кольцевая

Писатель Евгений Бабушкин делится своими наблюдениями за человечеством

Esquire
Свидания онлайн: найти пару, не покидая квартиры Свидания онлайн: найти пару, не покидая квартиры

Как индустрия виртуального дейтинга меняется под влиянием новых условий жизни?

Psychologies
Россия на экспорт Россия на экспорт

На фестивале Care’s итальянка из мишленовского ресторана готовила борщ

Bones
Кристофер Мискья и его машина, которая сама себя отключает Кристофер Мискья и его машина, которая сама себя отключает

Норвежец Кристофер Мискья – инженер до мозга костей

Популярная механика
Алкогений: Анатолий Папанов Алкогений: Анатолий Папанов

Народный артист Папанов достоверно играл как мужика, так и интеллигента

Maxim
Открыть в приложении