Перешли на личности

Эксперты предупреждают: приватность, лежащая в основе интернета, больше не работает

Автор: Наталья Севастьянова

Вооружившись нейросетями, мошенники начали «обрабатывать» граждан с беспрецедентной легкостью. Теперь они мгновенно собирают досье на жертв: где живут, какое у них имущество, чем больны, какие у них политические взгляды. Можно ли от этого защититься?

Одной из ценностей интернета всегда была анонимность: пользователи могли свободно высказываться, используя псевдонимы, — это защищало их от преследования. Эта эпоха заканчивается — с развитием искусственного интеллекта установить личность анонимов стало пугающе просто.

Команда исследователей из Федерального института технологии в Цюрихе (ETH Zurich) и компании Anthropic успешно применила большие языковые модели для массовой деанонимизации. ИИ без труда «расколол» большинство пользователей соцсетей, зная только их ники, — точно определял имя и фамилию человека, даже если тот писал в основном о том, какие фильмы любит или где гуляет с собакой.

Ваш агент Смит

Ученые из ETH Zurich и Anthropic использовали разработанный ими ИИ-агент для идентификации посетителей популярного форума Hacker News и соцсети Reddit. Эксперимент проходил так. Команда автоматически собрала данные из публичных соцсетей и форумов, затем программа проанализировала информацию, обращая внимание на особенности стиля письма, биографические детали, частоту и время публикаций. После этого она отсканировала миллионы других аккаунтов в соцсетях, форумах и на прочих сайтах, собирая в единые досье те, которые, предположительно, принадлежали одному и тому же человеку. Пометив вероятные совпадения, она анализировала их детальнее и формировала предположения, как зовут пользователей, сопоставляя досье на них с профилями в LinkedIn, где люди указывают настоящие имена.

Исследователи специально пытались усложнить машине задачу — удаляли из постов все ссылки, ведущие на какие-либо источники, где были указаны имена пользователей: им было важно, чтобы ИИ сам их установил. В итоге агент с легкостью решил эту задачу. Проанализировав переписку, он за несколько секунд раскрыл личности 68% пользователей.

«Мы обнаружили, что эти ИИ-агенты могут делать то, что раньше считалось очень сложным: получив текст в произвольном формате (например, анонимизированную запись разговора с человеком), они могут определить его личность. Это новая возможность: прежние подходы к идентификации обычно требовали структурированных данных и обязательно в двух наборах, собранных по схожей схеме, что позволяло бы их связать», — поясняет один из соавторов работы инженер Саймон Лермен. Эксперимент обошелся менее чем в $2000 — по $1–4 за профиль человека в зависимости от сложности задачи. Это значит, что инструмент можно без труда масштабировать на десятки тысяч пользователей, отмечает Лермен.

Пример: некто пишет, что у него трудности в школе, а еще он гуляет с собакой по кличке Волчок на Воронцовских прудах. ИИ ищет эти детали в других источниках и с высокой степенью уверенности сопоставляет данные из аккаунта с реальным московским подростком. Даже когда агент получал максимально неконкретные данные, например ответы на анкету о том, как люди используют ИИ в повседневной жизни, ему удавалось найти нужные подсказки и идентифицировать искомых персон в 7% случаев. А когда ИИ анализировал комментарии из сообществ Reddit, посвященных кино, точность идентификации была поразительной. Чем активнее люди обсуждали фильмы, тем проще ИИ было установить их имена.

«Пользователи, платформы и политики должны признать: приватность, лежащая в основе сегодняшнего интернета, больше не работает», — утверждается в работе, опубликованной по итогам исследования. Для идентификации неизвестного теперь хватает даже короткого поста — например, если он упоминает знакомых людей и места, где побывал.

Подарок Большому брату

Почему это вызывает тревогу? Авторы работы опасаются, что искусственный интеллект начнут применять для беспрецедентной по масштабам слежки за людьми. Правительствам не составит труда связывать анонимные аккаунты с реальными личностями, чтобы преследовать диссидентов, независимых журналистов или политических активистов, пытающихся скрыться за никнеймами. ИИ-слежка — быстроразвивающаяся область: большие языковые модели (LLM) позволяют мгновенно составлять досье на любого человека в интернете — задача, над которой живые сотрудники спецслужб корпели бы неделями, в итоге все равно упустив много важных деталей.

Хорошая новость в том, что правоохранительные органы смогут применять ИИ, чтобы отслеживать в сети преступников, например педофилов, террористов или агрессивных граждан, сыплющих серьезными угрозами. Но и тут есть риски: ИИ галлюцинирует, а значит, может приписать вам то, в чем вы неповинны. «Людей будут обвинять в том, чего они не делали», — предупреждает Питер Бентли, профессор информатики в Университетском колледже Лондона.