Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Рекомендуемые статьи

Как возникает новый тип самообразующегося спинового стекла

Чтобы держать мозг в форме, можно заняться «ментальным фитнесом»

На Луне обнаружено нечто действительно странное

Во всем работает правило золотой середины, в воспитании детей тоже

Создание книги ‒ сложный процесс, требующий от автора много сил и внимания

Героиня нашего материала предпочла остаться в одиночестве

Взлеты и мытарства графа Петра Шиловского и его двухколесного гирокара

Квартира, оформленная с уважением к итальянским традициям

У пациентов с нарушениями сознания нашли следы восприятия слов

Как сотрудник может защитить себя при сокращении

Фелисе Янкелль — о карантине, материнстве и русских

Эти советы помогут выбрать новый смартфон без лишних трат

Эти знаменитости смогли и престижный ВУЗ окончить, и «Оскар» получить

Пришло время сменить декорации!

Что изменилось бы в восприятии мира вокруг нас, если бы наши глаза видели фотоны

Что делать, если вы чувствуете апатию и слабость уже с обеда

Расстаемся со стереотипами!

Как можно быстро и без больших вложений обновить ваше жилье

Что нужно знать, чтобы интимная близость после родов была приятной и безопасной?

Человек, в которого могли бы влюбляться наши бабушки, но влюбляемся мы

Нефтяные котировки рухнули до уровней 2000-х, а цены на бензин не снижаются

Мало движения, много еды — все «тренды» отражаются на нашем внешнем виде

25 ошибок, которые чаще всего допускают в английском языке

Как гендерный дисбаланс мешает развитию инвестиций

Роботы в кино — это настоящее воплощение зла

Еда с Еленой Чекаловой

Как построить успешный бизнес и какие качества важны для предпринимателя

Ксения Рождественская о «Пожаре» Дэвида Линча

Что будет, если целую неделю питаться только афродизиаками?

Какие актеры столкнулись с ненавистью поклонников в реальной жизни