Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

РБКHi-Tech

Ложь, шум и капелька яда

Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

Автор: София Труцуненко, методический лид направления Data Science школы IT-профессий Skillfactory

Фото: Михаил Гребенщиков / РБК

Любой, кто работал с большими моделями ИИ (ChatGPT, Midjourney), знает, что сгенерированные тексты и изображения часто требуют коррекции или дополнительных уточнений. Нейросеть может придумывать цифры, создавать фальшивые объекты или признаки, которых на самом деле не было в исходных данных. Это довольно частое явление для больших генеративных моделей, которое еще называют галлюцинациями. Но за неправильными результатами могут скрываться не только ошибки модели, но и злонамеренные действия — отравление данных.

Что такое отравление данных

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности.

Чтобы понять, как работает отравление данных, нужно разобраться, как в общем работают алгоритмы машинного обучения. Изначально собирается большой набор данных, и от того, какие именно данные взяли, зависит результат. Следующий шаг — привести данные к одному формату, а для некоторых задач дополнительно снабдить их подсказками для алгоритма (разметкой). Далее алгоритм находит в них признаки и закономерности.

И когда обученный алгоритм сталкивается с данными, которые он еще не видел, он может решить эту задачу, опираясь на те правила, которые он для себя создал ранее. Отравление данных нарушает этот процесс, подмешивая в обучающий набор вредоносные сведения, которые искажают или запутывают обученный алгоритм.

Рассмотрим некоторые примеры таких атак.

  • Внесение шума (Noise Injection): добавление случайных или искаженных данных в обучающий набор.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Сквозь хаос девяностых к тревожным нулевым: «Сезон отравленных плодов» — роман о поколении тридцатилетних Сквозь хаос девяностых к тревожным нулевым: «Сезон отравленных плодов» — роман о поколении тридцатилетних

Отрывок из романа Веры Богдановой «Сезон отравленных плодов»

Esquire
На ее книгах вырос Стивен Кинг: как Ширли Джексон превращала свои страхи в литературу На ее книгах вырос Стивен Кинг: как Ширли Джексон превращала свои страхи в литературу

История писательницы, на романах которой вырос Стивен Кинг

Forbes
Ольга Сварник: «Мозгу постоянно нужна новизна» Ольга Сварник: «Мозгу постоянно нужна новизна»

О мире, где человек вынужден конкурировать с нейросетями

РБК
Что такое глутатион и почему это вещество так важно для организма? Что такое глутатион и почему это вещество так важно для организма?

Глутатион: полезные свойства антиоксиданта и как его восполнять

Psychologies
Как обрести уверенность в себе как в профессионале: 3 шага Как обрести уверенность в себе как в профессионале: 3 шага

Как выявить у себя синдром самозванца и что делать после

Psychologies
Как выявить и побороть кредитную зависимость: основные признаки и способы излечения Как выявить и побороть кредитную зависимость: основные признаки и способы излечения

Как самому себя вытащить из кредитной зависимости и больше в нее не попасть?

Psychologies
Василина Дрогичинская: «Цифровая доступность IT-продуктов становится общемировым трендом» Василина Дрогичинская: «Цифровая доступность IT-продуктов становится общемировым трендом»

Что такое «цифровая доступность» и как IT-сервисы делают удобными для всех

РБК
Сложное соседство: как жить в одном доме с кошкой, если у вас появилась аллергия Сложное соседство: как жить в одном доме с кошкой, если у вас появилась аллергия

Как ужиться в одной квартире с кошкой, если у вас появилась аллергия на нее?

ТехИнсайдер
Мужчина, позвольте… Мужчина, позвольте…

Как флирт помогает держать себя в тонусе: 5 неочевидных плюсов

Лиза
«Я думала, что никогда не сделаю аборт»: отрывок из романа о разрушающем чувстве вины «Я думала, что никогда не сделаю аборт»: отрывок из романа о разрушающем чувстве вины

Отрывок из повести Клаудии Пиньейро «Элена знает»

Forbes
Впервые за пять лет в топ-50 самых высокооплачиваемых спортсменов мира нет женщин Впервые за пять лет в топ-50 самых высокооплачиваемых спортсменов мира нет женщин

Пока в топ самых высокооплачиваемых спортсменов мира не попала ни одна женщина

Forbes
Драконы армянской демократии Драконы армянской демократии

Кризис образования, элиты и идентичности — вот слагаемые армянской катастрофы

Монокль
Итоги Канн-2024: почему фильм про сына русского олигарха «Анора» взял главный приз Итоги Канн-2024: почему фильм про сына русского олигарха «Анора» взял главный приз

Почему жюри во главе с Гервиг мог понравиться фильм Бэйкера

Forbes
Какие популярные игры были запрещены в разных странах Какие популярные игры были запрещены в разных странах

Собрали 8 известных игр, которые были запрещены в ряде стран

Maxim
6 признаков того, что в вашем рационе слишком много соли 6 признаков того, что в вашем рационе слишком много соли

Определить, что вы едите слишком много соли, можно по нескольким признакам

ТехИнсайдер
Спаржевый стартап Спаржевый стартап

Олег Жолобенко выращивает деликатесную агрокультуру в Черноземье

Агроинвестор
«Монтессори: Воспитание любовью»: байопик о женщине, которая изменила педагогику «Монтессори: Воспитание любовью»: байопик о женщине, которая изменила педагогику

«Монтессори: Воспитание любовью»: фильм про педагога, чья методика покорила мир

Forbes
Приятель Гая Ричи, партнер Кортни Кокс и враг Дэдпула: все фильмы Дэвида Бекхэма Приятель Гая Ричи, партнер Кортни Кокс и враг Дэдпула: все фильмы Дэвида Бекхэма

Актерская карьера экс-футболиста Дэвида Бекхэма

Forbes
Канны-2024: красота открывает и закрывает двери Канны-2024: красота открывает и закрывает двери

Некоторые из числа самых успешных фильмов Каннского конкурса

РБК
Будущее на кончике пера: писатели, которые знали, что нас ждет Будущее на кончике пера: писатели, которые знали, что нас ждет

Писатели, смелые фантазии которых сбылись на самом деле

Maxim
Медные слитки из минойского дворца Агия-Триада отлили из уральской руды Медные слитки из минойского дворца Агия-Триада отлили из уральской руды

Ученые проанализировали состав 15 медных слитков, обнаруженных на Крите

N+1
Отпуск по обмену Отпуск по обмену

Истории, в которых герои уже давно перестали на отдыхе пользоваться отелями

Новый очаг
Бомбовоз на тяжелом топливе: чем удивляет редкий дизельный бомбардировщик Ер-2 Бомбовоз на тяжелом топливе: чем удивляет редкий дизельный бомбардировщик Ер-2

Самолет, первым отбомбившийся по Берлину в начале войны

ТехИнсайдер
Двое российских миллиардеров из списка Forbes создают СП в области кибербезопасности Двое российских миллиардеров из списка Forbes создают СП в области кибербезопасности

Владимир Евтушенков и Юрий Максимов создают СП в области кибербезопасности

Forbes
Как выглядит новый корпус Третьяковской галереи и почему его строили почти 30 лет Как выглядит новый корпус Третьяковской галереи и почему его строили почти 30 лет

Чем примечателен новый корпус Третьяковской галереи?

СНОБ
Москва по-собянински: азиатский город с архитектурными доминантами и фасадами Москва по-собянински: азиатский город с архитектурными доминантами и фасадами

Какую Москву хочет построить Сергей Собянин?

Монокль
Вячеслав Дубынин: «Важно помнить, что кроме цифрового мира есть мир реальный» Вячеслав Дубынин: «Важно помнить, что кроме цифрового мира есть мир реальный»

Как человеческий мозг адаптируется к цифровой реальности

РБК
Не хочу, не буду!.. Не хочу, не буду!..

Как приучить детей к здоровой еде? Руководство для заботливых родителей

Лиза
Модный дом Модный дом

Респектабельный интерьер пентхауса в духе современной роскоши

SALON-Interior
Как понять, заслуживает ли человек доверия? Как понять, заслуживает ли человек доверия?

На что стоит обратить внимание при общении с малознакомыми людьми?

Psychologies
Открыть в приложении