Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Обман зрения: как популярные оптические иллюзии дурят наш мозг Обман зрения: как популярные оптические иллюзии дурят наш мозг

Оптические иллюзии - это прямое подтверждение того, что наш мозг чертовски ленив

Популярная механика
Обновлённая LADA 4x4. По канавам и святым местам Обновлённая LADA 4x4. По канавам и святым местам

Краткое описание обновлений LADA 4х4 занимает не больше абзаца

4x4 Club
Как советские автомобили рекламировали за рубежом Как советские автомобили рекламировали за рубежом

Немного выдумки, щепотка трэша

Maxim
Гендерные стереотипы не повлияли на доверие к роботам Гендерные стереотипы не повлияли на доверие к роботам

Чтобы не поддерживать стереотипы, стоит создавать гендерно-нейтральных роботов

N+1
Кажется, я его не люблю... Кажется, я его не люблю...

Надо ли осуждать тех матерей, чьи чувства к детям «молчат»?

Лиза
По зубам: как правильно ухаживать за полостью рта По зубам: как правильно ухаживать за полостью рта

Простые правила ухода за зубами, языком и деснами

Psychologies
Как Наоми Осака стала самой высокооплачиваемой спортсменкой в истории и обогнала Шарапову Как Наоми Осака стала самой высокооплачиваемой спортсменкой в истории и обогнала Шарапову

Как Наоми Осака заработала $37 млн, побив рекорд Марии Шараповой

Forbes
Связать и измерить Связать и измерить

Квантовые технологии обладают огромным потенциалом

N+1
Джоан Рамос: Ферма Джоан Рамос: Ферма

Первая глава феминистического романа Джоан Рамос

СНОБ
Как включить самообладание: правило 90 секунд Как включить самообладание: правило 90 секунд

Можем ли мы выбирать, как реагировать на раздражающие обстоятельства?

Psychologies
Интерьер с харизмой Интерьер с харизмой

Яркий интерьер, главным героем которого стала кухня глубокого синего цвета

SALON-Interior
Донорские стволовые клетки позволили новорожденному японцу дожить до пересадки печени Донорские стволовые клетки позволили новорожденному японцу дожить до пересадки печени

Первая в мире операция по пересадке клеток печени

N+1
Изоляция и гигиена Изоляция и гигиена

Человечество веками платило страшную цену

Дилетант
Борода спасла мужчин от перелома челюсти Борода спасла мужчин от перелома челюсти

Мужчины с бородой могли получать преимущество в драках за положение в группе

N+1
Разрушительная скупость. Как подготовка к затяжному кризису делает этот кризис затяжным Разрушительная скупость. Как подготовка к затяжному кризису делает этот кризис затяжным

Драматическое сокращение спроса в экономике

СНОБ
Как великие люди не стали теми, кем хотели Как великие люди не стали теми, кем хотели

Кем эти знаменитые люди на самом деле хотели стать

Weekend
Nissan Ariya. Бесконечный японский футуризм Nissan Ariya. Бесконечный японский футуризм

В концепте Ariya компания Nissan сосредоточила весь набор технологий будущего

4x4 Club
Как индустрия киберспорта переживает период самоизоляции Как индустрия киберспорта переживает период самоизоляции

Как развиваются виртуальные соревнования и почему не стоит их игнорировать

GQ
В атмосфере горячего юпитера не нашли рэлеевского рассеяния В атмосфере горячего юпитера не нашли рэлеевского рассеяния

Оно делает земное небо голубым для наших глаз

N+1
«Это адское испытание»: Леонид Парфенов и Павел Лунгин о пандемии, разоблачении власти и шансе для талантливых «Это адское испытание»: Леонид Парфенов и Павел Лунгин о пандемии, разоблачении власти и шансе для талантливых

Каким будет мир после карантина?

Forbes
Все массовые вымирания в истории Земли связали с глобальным потеплением Все массовые вымирания в истории Земли связали с глобальным потеплением

Все массовые вымирания в истории Земли были связаны с глобальным потеплением

N+1
10 внезапных фактов об изобретателях 10 внезапных фактов об изобретателях

Великие изобретатели были чертовски разносторонними личностями

Maxim
Что будет с человеком, если ему ампутировать половину мозга Что будет с человеком, если ему ампутировать половину мозга

Возможно ли жить только с половиной мозга, и что это будет за жизнь?

Популярная механика
Как меняется тело из-за пребывания в изоляции Как меняется тело из-за пребывания в изоляции

Чем опасна изоляция и что она способна сделать с вашим телом

Популярная механика
Жюльен Сандрель: Комната чудес Жюльен Сандрель: Комната чудес

Первая глава книги «Комната чудес» Жюльен Сандрель

СНОБ
Сомневаешься в своих силах? 5 типов синдрома самозванца (и как с ними бороться) Сомневаешься в своих силах? 5 типов синдрома самозванца (и как с ними бороться)

Некоторые из нас страдают синдромом самозванца, даже не подозревая об этом.

Playboy
Голое платье, кокошник и измена с прощением: удивительная жизнь Наталии Орейро Голое платье, кокошник и измена с прощением: удивительная жизнь Наталии Орейро

Вспоминаем любопытные моменты из биографии певицы Наталии Орейро

Cosmopolitan
Древнейшая мелодия в мире: как звучит Хурритский гимн №6 Древнейшая мелодия в мире: как звучит Хурритский гимн №6

Хурритские песни – старейшие «нотные записи»

Популярная механика
6 причин, почему ты несчастлив на своей работе (и что с этим делать) 6 причин, почему ты несчастлив на своей работе (и что с этим делать)

Какие причины могут вызвать неудовлетворение своей работой и что с этим делать?

Playboy
Хиромантия XXI века: антинаучно ли изучение линий на ладонях? Хиромантия XXI века: антинаучно ли изучение линий на ладонях?

Существуют ли закономерности между узорами на руке и личностными качествами

Популярная механика
Открыть в приложении