Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что приготовить из консервированного тунца, найденного в холодильнике: 8 крутых рецептов Что приготовить из консервированного тунца, найденного в холодильнике: 8 крутых рецептов

Что приготовить из тунца, консервированного в масле?

Playboy
Принцы и будущие президенты: горячие сыновья политиков – что мы о них знаем Принцы и будущие президенты: горячие сыновья политиков – что мы о них знаем

Самые завидные холостяки мира

Cosmopolitan
Распад нейтрального B-мезона отклонился от прогнозов Стандартной модели Распад нейтрального B-мезона отклонился от прогнозов Стандартной модели

Самый точный анализ измерений распада B-мезона на детекторе LHCb

N+1
Правила жизни Шона Бина Правила жизни Шона Бина

Правила жизни актера Шона Бина

Esquire
Судьба минимализма: Jil Sander SS 07, Celine SS 10, Hermes FW 15 Судьба минимализма: Jil Sander SS 07, Celine SS 10, Hermes FW 15

Новая версия минимализма от Рафа Симонса создала образ современной женщины

Weekend
Во френч-прессе, турке и гейзерной кофеварке: как сварить вкусный кофе дома Во френч-прессе, турке и гейзерной кофеварке: как сварить вкусный кофе дома

Как приготовить вкусный кофе дома — без кофемашины и профессионального опыта

Forbes
7 самых классных и самых безумных образов Сальвадора Дали 7 самых классных и самых безумных образов Сальвадора Дали

Готовы подкручивать усики?

GQ
Комментировать тело вашего партнера – плохая затея Комментировать тело вашего партнера – плохая затея

Мы не прочь услышать голую правду, но лишь когда на ней что-то надето

GQ
Галина Щербакова: Женщины в игре без правил Галина Щербакова: Женщины в игре без правил

Отрывок из нового романа Галины Щербаковой о судьбах трех поколений женщин

СНОБ
Торжество воды Торжество воды

Петергоф называют столицей фонтанов. Их здесь больше 150!

Лиза
Стойте, полиция! Как женщине путешествовать по Ирану в одиночку Стойте, полиция! Как женщине путешествовать по Ирану в одиночку

Исторические места Древняя Персия, нефтяные месторождения и остров Киш

Forbes
Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times

Каким был мастер составления некрологов Олден Уитмен?

Esquire
«Битва экстрасенсов»: топ-7 самых странно одетых участников шоу «Битва экстрасенсов»: топ-7 самых странно одетых участников шоу

Собрали для тебя топ-7 главных стиляг программы «Битвы экстрасенсов»

Cosmopolitan
Как фриланс влияет на здоровье: исследования, проблемы и решения Как фриланс влияет на здоровье: исследования, проблемы и решения

Фриланс многим представлялся как работа мечты, но у этого формата есть нюансы

РБК
Рассказ «Коконопряды» Теннесси Уильямса, который был опубликован в Esquire и лег в основу его последней пьесы Рассказ «Коконопряды» Теннесси Уильямса, который был опубликован в Esquire и лег в основу его последней пьесы

Рассказ «Коконопряды» Теннесси Уильямс написал в середине сороковых

Esquire
Просто товар Просто товар

Когда нефть перестанет быть нефтью?

Forbes
5 важных вопросов о косточке на стопе 5 важных вопросов о косточке на стопе

Можно ли избавиться от «косточки» на стопе раз и навсегда?

Лиза
«Туманная Дева»: первое электросудно Америки «Туманная Дева»: первое электросудно Америки

Суда на батарейках перестают быть редкостью

Популярная механика
Гарри ясно Гарри ясно

Дэниел Рэдклифф давно отошел от амплуа волшебника из Хогвартса

Esquire
Замечания по адресу Замечания по адресу

Какую роль играет адрес в жизни человека, здания или учреждения

Forbes
Танцевальные тренировки по видео: хип-хоп, табата, зумба и другие Танцевальные тренировки по видео: хип-хоп, табата, зумба и другие

Как разные танцевальные стили приспособили под тренировки

Psychologies
Фамильная ценность Фамильная ценность

Юная модель Стейнберг в самоизоляции времени даром не теряет

Vogue
Последние китайские предупреждения: можно ли использовать опыт КНР для выхода из кризиса в торговле? Последние китайские предупреждения: можно ли использовать опыт КНР для выхода из кризиса в торговле?

Ретейл в Китае возвращается к жизни после карантинных ограничений

Forbes
Не верь глазам Не верь глазам

Как не потерять деньги в Интернете?

Лиза
Как системы распознавания лиц справляются с масками Как системы распознавания лиц справляются с масками

Спойлер: если хотите скрыться от камер, лучше купите футболку с принтом

GQ
7 привычек собак и что они означают 7 привычек собак и что они означают

Так вот что собака имела ввиду, сказав «Мяу»

Maxim
«Каждый пятидесятый будет в шапочке из фольги»: Евгений Чичваркин о мире после пандемии, ошибке властей и неизбежном росте налогов «Каждый пятидесятый будет в шапочке из фольги»: Евгений Чичваркин о мире после пандемии, ошибке властей и неизбежном росте налогов

Евгений Чичваркин сделал неутешительные прогнозы на будущее

Forbes
8 способов отбросить сожаления 8 способов отбросить сожаления

Стоит ли долго заниматься самобичеванием, совершив ошибку и навредив кому-то?

Psychologies
Хитрая схема: почему бензин в России не дешевеет даже при ценах на нефть, как в 2000-х Хитрая схема: почему бензин в России не дешевеет даже при ценах на нефть, как в 2000-х

Нефтяные котировки рухнули до уровней 2000-х, а цены на бензин не снижаются

Forbes
Африканские барабаны: быстрая связь на дальние расстояния Африканские барабаны: быстрая связь на дальние расстояния

В тот момент, когда мы заканчиваем произносить слово, его больше не существует

Популярная механика
Открыть в приложении