Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

РБКHi-Tech

Ложь, шум и капелька яда

Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

Автор: София Труцуненко, методический лид направления Data Science школы IT-профессий Skillfactory

Фото: Михаил Гребенщиков / РБК

Любой, кто работал с большими моделями ИИ (ChatGPT, Midjourney), знает, что сгенерированные тексты и изображения часто требуют коррекции или дополнительных уточнений. Нейросеть может придумывать цифры, создавать фальшивые объекты или признаки, которых на самом деле не было в исходных данных. Это довольно частое явление для больших генеративных моделей, которое еще называют галлюцинациями. Но за неправильными результатами могут скрываться не только ошибки модели, но и злонамеренные действия — отравление данных.

Что такое отравление данных

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности.

Чтобы понять, как работает отравление данных, нужно разобраться, как в общем работают алгоритмы машинного обучения. Изначально собирается большой набор данных, и от того, какие именно данные взяли, зависит результат. Следующий шаг — привести данные к одному формату, а для некоторых задач дополнительно снабдить их подсказками для алгоритма (разметкой). Далее алгоритм находит в них признаки и закономерности.

И когда обученный алгоритм сталкивается с данными, которые он еще не видел, он может решить эту задачу, опираясь на те правила, которые он для себя создал ранее. Отравление данных нарушает этот процесс, подмешивая в обучающий набор вредоносные сведения, которые искажают или запутывают обученный алгоритм.

Рассмотрим некоторые примеры таких атак.

  • Внесение шума (Noise Injection): добавление случайных или искаженных данных в обучающий набор.
  • Удаление данных (Data Removal): исключение части данных из обучающего набора.
  • Вставка ложных объектов (Object Insertion): добавление несуществующих или ложных объектов в обучающий набор. Сюда же входят скрытые надписи, вотермарки, изображения.
  • Изменение меток классов (Label Flipping): изменение или искажение разметки классов в обучающем наборе. То есть данные не добавляются, но происходит подмена: например, картинки с кошками подписываются как картинки с собаками, и наоборот.

Но гораздо интереснее те методы, которые нельзя заметить, ведь современные отравленные данные могут выглядеть нормально для человеческого глаза, но при этом они тоже будут ломать алгоритм.

Одним из самых громких примеров отравления данных является программа Nightshade, созданная исследователями Чикагского университета. Это ответ на достаточно больную этическую тему для больших генеративных ИИ-моделей — проблему авторского права.

Чтобы обучить качественную модель на уровне DALL-E и Midjourney, нужно не просто много данных, нужно очень много данных. И многие большие модели не обладают правами на работы, которые использовались в обучении. А результат работы — сгенерированная картинка, которая не имеет признаков интеллектуальной собственности. Nightshade незаметно вставляет признаки одного объекта на картинки с другим. Там, где человеческий глаз увидит собаку, нейронная сеть может воспринимать признаки и контуры другого объекта, например кота. Это позволяет создавать искажения в изображениях, которые остаются незамеченными человеком, но влияют на работу модели искусственного интеллекта, обученной на этих данных. Изображения меняются таким образом, что видимая разница минимальна.

Зоны риска

Отравление данных — это очень серьезный метод воздействия на системы искусственного интеллекта, он может привести к различным по степени негативным последствиям в зависимости от контекста и особенностей атаки. На эффективность отравления данных влияют степень его скрытности и сложность обнаружения изменений.

Цели атаки и контекст также влияют на последствия — от обмана локальных систем безопасности до воздействия на масштабные финансовые или медицинские системы.

Сейчас отравление данных существует и на уровне прикладных инструментов для незащищенных некрупных систем, и как глобальная угроза безопасности, которая изучается ведущими учеными и отраслевыми специалистами.

Искусственный интеллект внедряется во все чувствительные сферы нашей жизни: финансы, медицину, пропускные системы и даже поиск преступников. Последствия отравления данных могут быть катастрофическими. Вот несколько примеров.

Распознавание лиц: злоумышленник может добавить в обучающий набор чужие изображения лиц, взятые из открытых источников. Это может привести к тому, что невиновного человека задержат правоохранительные органы.

Медицинские данные: подмена истории болезни пациента или результатов анализов в медицинских приложениях. Такая атака может привести к ложному диагнозу.

Финансовые данные: из-за добавления фальшивых транзакций или ухищрений в финансовые данные человеку могут предъявить необоснованные обвинения в финансовых махинациях. А атака большего масштаба может спровоцировать дестабилизацию рынка.

Дорожная ситуация (беспилотные автомобили): злоумышленник может добавить деформированные дорожные знаки или маркировку на дорогах в систему распознавания. Это может привести к авариям и несчастным случаям.

Способы защиты

Чтобы минимизировать риски отравления данных, необходим системный подход к кибербезопасности. С одной стороны, он должен включать традиционные методы: мониторинг сетей и использование брандмауэров, антивирусов и обновление программного обеспечения. Кроме того, для обнаружения вредоносных воздействий алгоритмами машинного обучения могут решаться такие задачи, как мониторинг аномалий, фильтрация и валидация данных после обучения.

Специалисту, работающему с большими моделями и сложными признаками, важно регулярно мониторить и изучать данные, которые он использовал для обучения моделей искусственного интеллекта. Это позволит своевременно выявлять подозрительные или аномальные паттерны, которые могут свидетельствовать о внедрении отравленных данных.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не те хромосомы, много тестостерона: почему на Олимпиадах так много гендерных скандалов Не те хромосомы, много тестостерона: почему на Олимпиадах так много гендерных скандалов

Кто такие интерсекс-люди и почему из-за них возникают скандалы на Олимпиаде?

Psychologies
Так держать! Так держать!

Способы исправления осанки, которые на самом деле только вредят спине

Лиза
Ольга Сварник: «Мозгу постоянно нужна новизна» Ольга Сварник: «Мозгу постоянно нужна новизна»

О мире, где человек вынужден конкурировать с нейросетями

РБК
Финтех на пороге квантового будущего: на что способны суперкомпьютеры и как они изменят нашу жизнь Финтех на пороге квантового будущего: на что способны суперкомпьютеры и как они изменят нашу жизнь

По мнению ученых, мы находимся на пороге Второй квантовой революции

ТехИнсайдер
Что такое маховик и для чего он нужен. Устройство и неисправности Что такое маховик и для чего он нужен. Устройство и неисправности

Все о маховике: что это и для чего нужно в автомобиле

РБК
Хвостатый рейс: в США открыли авиакомпанию премиум-класса для собак Хвостатый рейс: в США открыли авиакомпанию премиум-класса для собак

В этой авиакомпании все для... собак

ТехИнсайдер
Сумасшедшие бактерии меняют главную догму биологии: они сами себе создают новые гены Сумасшедшие бактерии меняют главную догму биологии: они сами себе создают новые гены

Как показали ученые, бактерии могут создавать сами себе новые гены

ТехИнсайдер
Эта диета «убивает» вас: 4 типа продуктов, которые ведут к диабету Эта диета «убивает» вас: 4 типа продуктов, которые ведут к диабету

Ученые и врачи уже давно знают, какая диета повышает риски развития диабета

ТехИнсайдер
К тебе или ко мне? К тебе или ко мне?

Как перевести отношения из сети в офлайн

Новый очаг
Сибирь, XXI век: что будет, если в России построят больше железных дорог Сибирь, XXI век: что будет, если в России построят больше железных дорог

Драйвером роста современной России снова станут железные дороги

ТехИнсайдер
Похитители молодости: 5 вещей в твоем доме, которые тихо приближают старость Похитители молодости: 5 вещей в твоем доме, которые тихо приближают старость

Экзогенные токсины в доме могут оказывать серьезное воздействие на организм

VOICE
Станет ли ваш мужчина хорошим отцом? Ответьте на 6 вопросов, чтобы понять Станет ли ваш мужчина хорошим отцом? Ответьте на 6 вопросов, чтобы понять

Признаки, по которым можно определить потенциально хорошего папу

Psychologies
Дубовые веточки вместо щеток и смола вместо паст: чем чистили зубы наши предки Дубовые веточки вместо щеток и смола вместо паст: чем чистили зубы наши предки

Благодаря кому и как человечество смогло получить электрические щетки?

Psychologies
Источники энергии Источники энергии

Почему кетодиета подходит не всем?

Лиза
«Пища для ума»: 10 продуктов, необходимых для здоровья мозга «Пища для ума»: 10 продуктов, необходимых для здоровья мозга

Продукты, которые помогут улучшить память и работу мозга в целом

ТехИнсайдер
«Наша задача — не кости с места на место перенести, а достойно похоронить в братской могиле». Как в Московской области ищут останки пропавших без вести солдат «Наша задача — не кости с места на место перенести, а достойно похоронить в братской могиле». Как в Московской области ищут останки пропавших без вести солдат

Как поиск солдат из мальчишеского увлечения превратился в серьезную миссию

СНОБ
Как оригинально! Декрета, Гипотенуза и другие популярные имена для девочек в СССР Как оригинально! Декрета, Гипотенуза и другие популярные имена для девочек в СССР

На популярность имен новорожденных в разное время влияли исторические события

Лиза
Как травма становится стимулом для роста: 7 необходимых этапов Как травма становится стимулом для роста: 7 необходимых этапов

Душевные травмы: калечат или дают стимул для внутреннего развития?

Psychologies
Не все коты одинаково полезны. История Непотопляемого Сэма — самого везучего кота в истории Не все коты одинаково полезны. История Непотопляемого Сэма — самого везучего кота в истории

Как кот Сэм три раза тонул, стал героем флота и дожил до старости

ТехИнсайдер
Пятый, индустриальный Пятый, индустриальный

Кадровые перестановки в правительстве и Администрации президента

Монокль
Зеленый бум Зеленый бум

Действительно ли натуральная косметика может заменить «химию»?

Лиза
Роковое увлечение: как жить, если у твоего мужчины есть серьезное хобби Роковое увлечение: как жить, если у твоего мужчины есть серьезное хобби

Музыка,  рыбалка, фотография — его хобби только притворяются милыми и невинными!

VOICE
Любовь не помеха: почему люди изменяют даже в счастливых отношениях — 6 обидных причин Любовь не помеха: почему люди изменяют даже в счастливых отношениях — 6 обидных причин

Почему измена происходит даже в семьях, где супруги по-настоящему счастливы?

Psychologies
Как выявить и побороть кредитную зависимость: основные признаки и способы излечения Как выявить и побороть кредитную зависимость: основные признаки и способы излечения

Как самому себя вытащить из кредитной зависимости и больше в нее не попасть?

Psychologies
Язык цветов Язык цветов

Учимся выражать чувства с помощью правильно составленного букета

Лиза
Жизнь без еды Жизнь без еды

Среди насекомых есть виды, которые во взрослом состоянии не питаются вовсе

Наука и жизнь
«Любуйтесь, мамаша, вот он, ребенок ваш»: как женщины переживают акушерское насилие «Любуйтесь, мамаша, вот он, ребенок ваш»: как женщины переживают акушерское насилие

Книга казахской писательницы Алтынай Султан об опыте беременности

Forbes
Как окружение влияет на наш успех: 3 типа людей, которых стоит избегать Как окружение влияет на наш успех: 3 типа людей, которых стоит избегать

Как негативные люди влияют на наш успех?

Psychologies
Знай свой двигатель: как отличить компрессор от турбонаддува Знай свой двигатель: как отличить компрессор от турбонаддува

Что такое компрессор? Что такое турбонаддув? Что из них лучше?

ТехИнсайдер
Большая игра: как гейминг все больше становится инструментом госполитики Большая игра: как гейминг все больше становится инструментом госполитики

Как видеоигры становятся инструментом пропаганды и психологической войны?

Forbes
Открыть в приложении