В приватном режиме: как обеспечить сохранность личных данных, используя нейросети
Отсутствие приватности данных при использовании нейронных сетей — одна из ключевых проблематик на 2024 год, в первую очередь для финансового сектора, государственных информационных систем и медицинских организаций. Поэтому в ближайшее время будут активно развиваться методы обезличивания персональных данных для нейронных сетей как механизмы обеспечения приватности пользователей. Заместитель руководителя лаборатории криптографии по научной работе в компании «Криптонит» Иван Чижов рассуждает о важных задачах, которые стоят перед компаниями — разработчиками информационных систем, обрабатывающих персональные данные.
Задача 1: Обучение нейросетей на обезличенном массиве данных
Большинство информационных систем, которыми мы пользуемся, собирают статистику. Например, если это интернет-магазин, платформа собирает информацию, что и когда мы покупаем, сколько денег мы в среднем тратим и так далее. Потом нейронная сеть обучается на этих данных, и создается модель. Но проблема в том, что это — данные реальных пользователей, наши с вами. Зачастую такой набор информации позволяет идентифицировать конкретного человека. Поэтому одна из первых задач — обеспечить обучение нейросетей на зашифрованных данных.
Задача 2: Обеспечение анонимизации данных, поступающих в нейросеть
Представьте, что вы хотите обработать фотографию с помощью нейросети. Вы открываете приложение, загружаете свое фото и просите сервис выполнить задачу. Здесь возникает еще одна проблема: посылая запрос в систему, мы используем свои личные данные — фотографию. Но это безобидный пример. Теперь представьте, что это сервис для получения информации о состоянии вашего здоровья. Чтобы получить диагноз, вы посылаете свои анализы, снимки — некую чувствительную медицинскую информацию, которой вы бы не хотели делиться. Но как этими данными распорядится сервис? Не произойдет