Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

9 языков программирования, которые помогут зарабатывать до $150 тыс. в год 9 языков программирования, которые помогут зарабатывать до $150 тыс. в год

Рейтинг языков программирования по возрастанию дохода

Inc.
7 фактов о супермодели Наоми Кэмпбелл — важных и неожиданных 7 фактов о супермодели Наоми Кэмпбелл — важных и неожиданных

Главные факты о Наоми Кэмпбелл, ее блестящей карьере и неоднозначных выходках

Esquire
Развод с Фоменко и любовь ради пиара. Жизненные неурядицы Марии Голубкиной Развод с Фоменко и любовь ради пиара. Жизненные неурядицы Марии Голубкиной

Мария Голубкина была замужем за Фоменко и встречалась с Василием Ливановым

Cosmopolitan
Пусть цветут все цветы Пусть цветут все цветы

Зачем мать пятерых детей стала президентом Специальной Олимпиады России

Tatler
Археологи предложили новый способ поиска древнего пива Археологи предложили новый способ поиска древнего пива

Археологи экспериментально проверили способ выявления следов пива

N+1
«Простая человеческая слабость может сделать больше, чем идеальный имидж» «Простая человеческая слабость может сделать больше, чем идеальный имидж»

Почему возможность показать свою уязвимость — путь сильных и успешных людей

Psychologies
Джордж Оруэлл Джордж Оруэлл

Правила жизни Джорджа Оруэлла

Esquire
Спиннер превратили в экспресс-тест для диагностики инфекций мочевых путей Спиннер превратили в экспресс-тест для диагностики инфекций мочевых путей

Для работы теста его нужно крутить так же, как и обычный спиннер

N+1
Поток метана от арктических морей: Взгляд из космоса Поток метана от арктических морей: Взгляд из космоса

Какова роль метана в потеплении Арктики?

Наука и жизнь
Улучшающий запоминание шрифт не улучшил запоминание Улучшающий запоминание шрифт не улучшил запоминание

Sans Forgetica нужно переименовать в Sans Remembica (ба-дум-тсс)

N+1
Валерия Розов: Что делать, если вас сокращают? Валерия Розов: Что делать, если вас сокращают?

Как сотрудник может защитить себя при сокращении

СНОБ
Ученые успешно воспроизвели аспекты теории перспектив Ученые успешно воспроизвели аспекты теории перспектив

Теорию перспектив из работы Канемана и Тверски удалось применить на практике

N+1
Вся правда о комбуче, или насколько полезен чайный гриб Вся правда о комбуче, или насколько полезен чайный гриб

Какие полезные вещества содержит комбуча и как она влияет на здоровье?

РБК
Затмила Монику Беллуччи? Кто такая Дева Кассель и почему ее ждет большое будущее Затмила Монику Беллуччи? Кто такая Дева Кассель и почему ее ждет большое будущее

Что известно о дочери Моники Беллуччи и каких успехов она уже добилась

Cosmopolitan
До лампочки: вредно ли ездить с пустым баком До лампочки: вредно ли ездить с пустым баком

Часто водители ездят до момента, пока не загорается лампа низкого уровня топлива

Популярная механика
«Я обалдел от масштаба «трагедии»»: стилист Киркорова пришел в шок от его одежды «Я обалдел от масштаба «трагедии»»: стилист Киркорова пришел в шок от его одежды

Стилист Филиппа Киркорова рассказал о первом рабочем дне у артиста

Cosmopolitan
Танки слабые и всемогущие: поражения и триумфы Великой Отечественной Танки слабые и всемогущие: поражения и триумфы Великой Отечественной

На войне количество не стало качеством

Популярная механика
Окончательная победа США: как Россия безнадежно отстала от Америки в космической гонке Окончательная победа США: как Россия безнадежно отстала от Америки в космической гонке

Запуск Crew Dragon знаменует начало века Pax Americana в космосе

Forbes
Как делают стволы для снайперских винтовок: отвечает Влад Лобаев Как делают стволы для снайперских винтовок: отвечает Влад Лобаев

Как делают стволы для снайперских винтовок и как технологии влияют на точность?

Популярная механика
5 дизайнерских отелей, в которых хочется побывать после карантина 5 дизайнерских отелей, в которых хочется побывать после карантина

Пять отелей, где настроение определяет дизайн пространства

РБК
Как менялся с годами образ Лады Дэнс — эволюция стиля главного секс-символа 90-х Как менялся с годами образ Лады Дэнс — эволюция стиля главного секс-символа 90-х

Как менялась с годами одна из самых ярких исполнительниц 90-х Лада Дэнс

Cosmopolitan
Напечатанная микроракета промчалась по кровеносному сосуду Напечатанная микроракета промчалась по кровеносному сосуду

Среди микророботов был установлен рекорд скорости в 2,8 миллиметра в секунду

N+1
Renault обновила кроссовер Kaptur — немного ярче, немного удобнее, немного дороже Renault обновила кроссовер Kaptur — немного ярче, немного удобнее, немного дороже

Обновленный Ranault Kaptur выглядит сочнее и стоит дороже миллиона

Maxim
Хотите эксперимент? Хотите эксперимент?

Идеи блюд, которые обязательно стоит попробовать летом

Домашний Очаг
Инопланетяне, где вы? Одни ли мы во Вселенной Инопланетяне, где вы? Одни ли мы во Вселенной

Повезло ли кому-нибудь во Вселенной так же, как и нам?

Популярная механика
Что доводит до Киева. 100 лет советско-польской войне Что доводит до Киева. 100 лет советско-польской войне

Век назад на берегах Днепра завязывался узел, который мы развязываем до сих пор

СНОБ
Ограничения стали новой нормой: как изменится жизнь после карантина Ограничения стали новой нормой: как изменится жизнь после карантина

Некоторые государства постепенно смягчают ограничения, введенные из-за пандемии

Forbes
Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов

3D-принтер из фантазий фанатов научпопа превратился в реальность ретейла

Esquire
Машина апокалипсиса: как скрестить ракетовоз с тепловозом Машина апокалипсиса: как скрестить ракетовоз с тепловозом

История знает немало амбициозных проектов по скрещиванию техники

Популярная механика
Как в России планировали бороться с пьянством, но вместо этого боролись с трезвостью Как в России планировали бороться с пьянством, но вместо этого боролись с трезвостью

Краткая история отношений государства с водкой

Weekend
Открыть в приложении