Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пчелиный яд разрушил клетки агрессивного рака молочной железы Пчелиный яд разрушил клетки агрессивного рака молочной железы

Компонент пчелиного яда мелиттин разрушает опухоли

N+1
Самые известные психонавты Самые известные психонавты

Семь знаменитых первооткрывателей, практиковавших психонавтику

Популярная механика
Абсурдное искусство Тео Каккуфы: по мотивам Кафки Абсурдное искусство Тео Каккуфы: по мотивам Кафки

Тео Каккуфа превращает банальные предметы в неожиданные кинетические арт-объекты

Популярная механика
Почему нам так нравится секс — и другие аспекты сексуального поведения человека Почему нам так нравится секс — и другие аспекты сексуального поведения человека

Почему люди занимаются сексом, когда им вздумается?

Esquire
9 абсурдно длинных киносмертей 9 абсурдно длинных киносмертей

В процессе умирания киногерои умудряются совершить больше, чем люди за всю жизнь

Maxim
7 фактов о супермодели Наоми Кэмпбелл — важных и неожиданных 7 фактов о супермодели Наоми Кэмпбелл — важных и неожиданных

Главные факты о Наоми Кэмпбелл, ее блестящей карьере и неоднозначных выходках

Esquire
«Панцерфауст» всемогущий: миф о немецком чудо-оружие «Панцерфауст» всемогущий: миф о немецком чудо-оружие

Насколько были эффективны немецкие ручные противотанковые гранатомёты?

Популярная механика
История картины Сальвадора Дали «Распятый Христос», которую украли прямо из-под носа у тюремного караула История картины Сальвадора Дали «Распятый Христос», которую украли прямо из-под носа у тюремного караула

В один день несколько воров решили, что на этой картине можно кое-что заработать

Esquire
Нанодвигатель: как работает мотор, созданный бактериями Нанодвигатель: как работает мотор, созданный бактериями

Как работает клеточный двигатель, изобретенный бактериями

Популярная механика
Хищным динозаврам в верхней юре пришлось глодать кости родственников Хищным динозаврам в верхней юре пришлось глодать кости родственников

Экосистема, в которую входили эти динозавры, была основательно нарушена

N+1
«Рождение таблетки. Как четверо энтузиастов переоткрыли секс и совершили  революцию» «Рождение таблетки. Как четверо энтузиастов переоткрыли секс и совершили  революцию»

Кто такая Сэнгер, Пинкус знал, да и почти вся Америка знала

N+1
10 внезапных фактов об изобретателях 10 внезапных фактов об изобретателях

Великие изобретатели были чертовски разносторонними личностями

Maxim
Разная война. Почему у Путина не получается защитить «итоги Второй мировой» Разная война. Почему у Путина не получается защитить «итоги Второй мировой»

Юбилей Победы Россия встречает в странных обстоятельствах

СНОБ
Работа видится на расстоянии Работа видится на расстоянии

Как специалисты разных профессий осваивают онлайн-форматы

Огонёк
«Теперь работать будем в два раза больше»: Касперский о последствиях пандемии, «русском Илоне Маске» и Zoom «Теперь работать будем в два раза больше»: Касперский о последствиях пандемии, «русском Илоне Маске» и Zoom

Разговор о бизнесе с российским программистом и бизнесменом Евгением Касперским

Forbes
Интерьер с харизмой Интерьер с харизмой

Яркий интерьер, главным героем которого стала кухня глубокого синего цвета

SALON-Interior
7 кинозвезд-преступников 7 кинозвезд-преступников

Великие актеры способны на большее, чем превышение скорости и неуплата налогов

Maxim
Пять звезд в чистом поле: как в России построили первый с советских времен аэропорт Пять звезд в чистом поле: как в России построили первый с советских времен аэропорт

Как появился Ростовский Платов и почему не все авиакомпании могут здесь садиться

Forbes
25 лучших фильмов о Второй мировой войне 25 лучших фильмов о Второй мировой войне

Обязательный список фильмов о Второй мировой войне

Maxim
Декрет — это не курорт. Что не так с восприятием материнства обществом Декрет — это не курорт. Что не так с восприятием материнства обществом

Как найти общий язык с ребенком и баланс между вашими потребностями

Forbes
Антивирус: жизнь после карантина Антивирус: жизнь после карантина

Как привыкнуть к новым реалиям и сохранить психическое здоровье

Cosmopolitan
Единство смартфона и содержания Единство смартфона и содержания

Что такое скринлайф и есть ли у него будущее

Огонёк
Как найти свой стиль без помощи специалиста? Рассказывает стилист Как найти свой стиль без помощи специалиста? Рассказывает стилист

Поиск индивидуального стиля – задачка не из простых

Cosmopolitan
Узор на спине гадюк оказался одновременно камуфляжем и предупреждающим сигналом Узор на спине гадюк оказался одновременно камуфляжем и предупреждающим сигналом

Узор, характерный для обыкновенной гадюки, может выполнять несколько функций

N+1
Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов

3D-принтер из фантазий фанатов научпопа превратился в реальность ретейла

Esquire
Вся чешусь и падаю без сил: как твое тело реагирует на токсичные отношения Вся чешусь и падаю без сил: как твое тело реагирует на токсичные отношения

Токсичные отношения действуют не только на психику, но и на тело тоже

Cosmopolitan
Боеголовка: что внутри и как она работает после отделения от ракеты Боеголовка: что внутри и как она работает после отделения от ракеты

Как боеголовки достигают цели

Популярная механика
Сериал «Светила»: Ева Грин, астрология и золотая лихорадка Сериал «Светила»: Ева Грин, астрология и золотая лихорадка

На «Амедиатеке» вышел сериал, в котором без 100 грамм не разберешься точно

GQ
Пещерные львы навсегда расстались со своими собратьями полмиллиона лет назад Пещерные львы навсегда расстались со своими собратьями полмиллиона лет назад

Что показало масштабное исследование эволюции современных и вымерших львов

N+1
Как изменится туризм после пандемии: 8 прогнозов от тревел-экспертов Как изменится туризм после пандемии: 8 прогнозов от тревел-экспертов

Когда-нибудь мы вновь отправимся путешествовать, но немного по-другому

Playboy
Открыть в приложении