Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

РБКHi-Tech

Ложь, шум и капелька яда

Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

Автор: София Труцуненко, методический лид направления Data Science школы IT-профессий Skillfactory

Фото: Михаил Гребенщиков / РБК

Любой, кто работал с большими моделями ИИ (ChatGPT, Midjourney), знает, что сгенерированные тексты и изображения часто требуют коррекции или дополнительных уточнений. Нейросеть может придумывать цифры, создавать фальшивые объекты или признаки, которых на самом деле не было в исходных данных. Это довольно частое явление для больших генеративных моделей, которое еще называют галлюцинациями. Но за неправильными результатами могут скрываться не только ошибки модели, но и злонамеренные действия — отравление данных.

Что такое отравление данных

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности.

Чтобы понять, как работает отравление данных, нужно разобраться, как в общем работают алгоритмы машинного обучения. Изначально собирается большой набор данных, и от того, какие именно данные взяли, зависит результат. Следующий шаг — привести данные к одному формату, а для некоторых задач дополнительно снабдить их подсказками для алгоритма (разметкой). Далее алгоритм находит в них признаки и закономерности.

И когда обученный алгоритм сталкивается с данными, которые он еще не видел, он может решить эту задачу, опираясь на те правила, которые он для себя создал ранее. Отравление данных нарушает этот процесс, подмешивая в обучающий набор вредоносные сведения, которые искажают или запутывают обученный алгоритм.

Рассмотрим некоторые примеры таких атак.

  • Внесение шума (Noise Injection): добавление случайных или искаженных данных в обучающий набор.
  • Удаление данных (Data Removal): исключение части данных из обучающего набора.
  • Вставка ложных объектов (Object Insertion): добавление несуществующих или ложных объектов в обучающий набор. Сюда же входят скрытые надписи, вотермарки, изображения.
  • Изменение меток классов (Label Flipping): изменение или искажение разметки классов в обучающем наборе. То есть данные не добавляются, но происходит подмена: например, картинки с кошками подписываются как картинки с собаками, и наоборот.

Но гораздо интереснее те методы, которые нельзя заметить, ведь современные отравленные данные могут выглядеть нормально для человеческого глаза, но при этом они тоже будут ломать алгоритм.

Одним из самых громких примеров отравления данных является программа Nightshade, созданная исследователями Чикагского университета. Это ответ на достаточно больную этическую тему для больших генеративных ИИ-моделей — проблему авторского права.

Чтобы обучить качественную модель на уровне DALL-E и Midjourney, нужно не просто много данных, нужно очень много данных. И многие большие модели не обладают правами на работы, которые использовались в обучении. А результат работы — сгенерированная картинка, которая не имеет признаков интеллектуальной собственности. Nightshade незаметно вставляет признаки одного объекта на картинки с другим. Там, где человеческий глаз увидит собаку, нейронная сеть может воспринимать признаки и контуры другого объекта, например кота. Это позволяет создавать искажения в изображениях, которые остаются незамеченными человеком, но влияют на работу модели искусственного интеллекта, обученной на этих данных. Изображения меняются таким образом, что видимая разница минимальна.

Зоны риска

Отравление данных — это очень серьезный метод воздействия на системы искусственного интеллекта, он может привести к различным по степени негативным последствиям в зависимости от контекста и особенностей атаки. На эффективность отравления данных влияют степень его скрытности и сложность обнаружения изменений.

Цели атаки и контекст также влияют на последствия — от обмана локальных систем безопасности до воздействия на масштабные финансовые или медицинские системы.

Сейчас отравление данных существует и на уровне прикладных инструментов для незащищенных некрупных систем, и как глобальная угроза безопасности, которая изучается ведущими учеными и отраслевыми специалистами.

Искусственный интеллект внедряется во все чувствительные сферы нашей жизни: финансы, медицину, пропускные системы и даже поиск преступников. Последствия отравления данных могут быть катастрофическими. Вот несколько примеров.

Распознавание лиц: злоумышленник может добавить в обучающий набор чужие изображения лиц, взятые из открытых источников. Это может привести к тому, что невиновного человека задержат правоохранительные органы.

Медицинские данные: подмена истории болезни пациента или результатов анализов в медицинских приложениях. Такая атака может привести к ложному диагнозу.

Финансовые данные: из-за добавления фальшивых транзакций или ухищрений в финансовые данные человеку могут предъявить необоснованные обвинения в финансовых махинациях. А атака большего масштаба может спровоцировать дестабилизацию рынка.

Дорожная ситуация (беспилотные автомобили): злоумышленник может добавить деформированные дорожные знаки или маркировку на дорогах в систему распознавания. Это может привести к авариям и несчастным случаям.

Способы защиты

Чтобы минимизировать риски отравления данных, необходим системный подход к кибербезопасности. С одной стороны, он должен включать традиционные методы: мониторинг сетей и использование брандмауэров, антивирусов и обновление программного обеспечения. Кроме того, для обнаружения вредоносных воздействий алгоритмами машинного обучения могут решаться такие задачи, как мониторинг аномалий, фильтрация и валидация данных после обучения.

Специалисту, работающему с большими моделями и сложными признаками, важно регулярно мониторить и изучать данные, которые он использовал для обучения моделей искусственного интеллекта. Это позволит своевременно выявлять подозрительные или аномальные паттерны, которые могут свидетельствовать о внедрении отравленных данных.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Несогласие со смертью: почему у умирающих вся жизнь проносится перед глазами? Несогласие со смертью: почему у умирающих вся жизнь проносится перед глазами?

Что происходит с мозгом сразу после последнего удара сердца

Вокруг света
Режиссер Халед Уануки: Популярность Чехова в Алжире вполне соответствует его популярности в России Режиссер Халед Уануки: Популярность Чехова в Алжире вполне соответствует его популярности в России

Халед Уануки о его взглядах на русскую литературу и впечатлениях от фестиваля

СНОБ
Ольга Сварник: «Мозгу постоянно нужна новизна» Ольга Сварник: «Мозгу постоянно нужна новизна»

О мире, где человек вынужден конкурировать с нейросетями

РБК
Тревожная демография: как резкое снижение рождаемости влияет на глобальную экономику и кто на этом зарабатывает Тревожная демография: как резкое снижение рождаемости влияет на глобальную экономику и кто на этом зарабатывает

Как связаны глобальная экономика и снижение рождаемости?

Inc.
Почему некоторые кабриолеты называют спайдерами и при чем тут пауки Почему некоторые кабриолеты называют спайдерами и при чем тут пауки

Слово Spider кажется совершенно неуместным, когда речь заходит об автомобилях

Maxim
Москва по-собянински: азиатский город с архитектурными доминантами и фасадами Москва по-собянински: азиатский город с архитектурными доминантами и фасадами

Какую Москву хочет построить Сергей Собянин?

Монокль
По капле крови По капле крови

Донорство крови: главные факты, которые важно знать

Лиза
«Очарованный принц». Что делать, если ребенок бессовестно льстит и манипулирует «Очарованный принц». Что делать, если ребенок бессовестно льстит и манипулирует

Как дети льстят и манипулируют, и что с этим делать

СНОБ
От «Хулиганов и ботанов» до «Эйфории»: 10 увлекательных подростковых сериалов От «Хулиганов и ботанов» до «Эйфории»: 10 увлекательных подростковых сериалов

Важные шоу о юношестве: без демогоргонов и супергероев

Правила жизни
«Память»: драма с Джессикой Честейн о том, как мы переживаем травмы и забываем их «Память»: драма с Джессикой Честейн о том, как мы переживаем травмы и забываем их

Как режиссер Мишель Франко говорит о проживании трагедии в фильме «Память»

Forbes
Психологическая поддержка для мужчин: как выбрать специалиста — чек-лист Психологическая поддержка для мужчин: как выбрать специалиста — чек-лист

Как мужчине как не ошибиться с выбором специалиста и как оценить терапию?

Psychologies
6 признаков того, что в вашем рационе слишком много соли 6 признаков того, что в вашем рационе слишком много соли

Определить, что вы едите слишком много соли, можно по нескольким признакам

ТехИнсайдер
Удивительная находка! Майя «благословляли» площадки для игры в мяч галлюциногенными растениями Удивительная находка! Майя «благословляли» площадки для игры в мяч галлюциногенными растениями

Археологи использовали ДНК, чтобы сделать «экстраординарное» открытие

ТехИнсайдер
От выгорания к гармонии: как построить здоровые отношения с работой От выгорания к гармонии: как построить здоровые отношения с работой

Отрывок из книги «Я больше не хочу всем нравиться»

Inc.
Мария Михалкова-Кончаловская: «Каждый проходит через отречение, чтобы потом понять, насколько это ценный дар — семья» Мария Михалкова-Кончаловская: «Каждый проходит через отречение, чтобы потом понять, насколько это ценный дар — семья»

Неважно, кто твои предки. Параллели прослеживаются ведь в любой семье

Коллекция. Караван историй
Все на себе. Когда в семье все упрекают друг друга Все на себе. Когда в семье все упрекают друг друга

Как быть, если в семье все недовольны друг другом? Как реагировать на обиды?

СНОБ
Почему желтеет маникюр и как избежать изменения цвета лака для ногтей Почему желтеет маникюр и как избежать изменения цвета лака для ногтей

Как предотвратить желтизну маникюра со стойким покрытием

VOICE
7 фильмов о великих художниках 7 фильмов о великих художниках

Выдающиеся фильмы о живописцах, от эпохи Возрождения до XX века

СНОБ
Штормовое предупреждение. 4 факта про укачивание (кинетоз) Штормовое предупреждение. 4 факта про укачивание (кинетоз)

Ищем оптимальное решение от «морской болезни» у детей

Лиза
От моря до облака От моря до облака

Как работают подводные кабели и чем грозит их повреждение

РБК
6 советских и российских фильмов — лауреатов Каннского фестиваля 6 советских и российских фильмов — лауреатов Каннского фестиваля

Шесть отечественных картин, которые в разные годы покорили Канны

СНОБ
Проверка жениха и невесты на прочность: 7 необычных свадебных ритуалов в разных странах Проверка жениха и невесты на прочность: 7 необычных свадебных ритуалов в разных странах

Сколько в мире культур — столько и вариантов справить свадьбу

ТехИнсайдер
Почему кот устраивает концерты по ночам: разбираемся в причинах такого поведения Почему кот устраивает концерты по ночам: разбираемся в причинах такого поведения

Как объяснить питомцу, что ночью нужно спать?

ТехИнсайдер
Видеть талант в каждом: как Елена Гнесина посвятила жизнь обучению музыке Видеть талант в каждом: как Елена Гнесина посвятила жизнь обучению музыке

История Елены Гнесиной, основавшей один из главных музыкальных вузов в России

Forbes
Кто так строит: как «Дом-2» стал самым известным долгостроем страны Кто так строит: как «Дом-2» стал самым известным долгостроем страны

Самые громкие скандалы, самые важные имена и самые значимые вехи телепроекта

Правила жизни
«Я буду всегда с тобой»: что такое сталкинг и как от него защититься в России? «Я буду всегда с тобой»: что такое сталкинг и как от него защититься в России?

Сталкинг: почему люди преследуют других людей?

Правила жизни
«Папа Урбан II на площади Клермона проповедует первый крестовый поход» «Папа Урбан II на площади Клермона проповедует первый крестовый поход»

Картина Франческо Айеца, на которой запечатлено начало крестовых походов

Дилетант
Море без границ Море без границ

Bering Yachts разработала проект моторной суперъяхты Bering B165

Y Magazine
Красный, как помидор: почему во время тренировки краснеет лицо и как это можно предотвратить Красный, как помидор: почему во время тренировки краснеет лицо и как это можно предотвратить

Почему люди краснеют во время занятий спортом?

ТехИнсайдер
Какие продукты делают друг друга еще полезнее Какие продукты делают друг друга еще полезнее

Что такое «пищевая синергия» и как воспользоваться ей по максимуму

Maxim
Открыть в приложении