Как АНБ получает наши личные данные и что с ними делает?
Летом 2013 года мир был взбудоражен сенсационной новостью: Эдвард Сноуден, сотрудник Агентства национальной безопасности (АНБ), организовал утечку засекреченной документации, подробно описывающей, как правительство США использует информационные технологии для слежки за потенциальными террористами. Сквозь эту брешь к нам хлынули сведения о том, что секретные службы собирают миллионы телефонных звонков, электронных писем, фотографий и видеороликов, получая их от Google, Facebook (Социальная сеть признана экстремистской и запрещена на территории Российской Федерации), Microsoft и других гигантов в сфере коммуникаций. Но что же делают потом с этой информацией агентства типа АНБ?
Какие объемы данных мы с вами производим? Согласно недавним исследованиям, проведенным компанией IBM, человечество порождает ежедневно 2,5 квинтиллиона байтов информации. (Если эти байты представить как уложенные плашмя плотно друг к другу монетки, то они бы покрыли весь земной шар в пять слоев.) В эту сумму включается записанная информация — фотографии, видеоролики, сообщения в социальных сетях, текстовые файлы, записи телефонных разговоров, финансовые отчеты и результаты научных экспериментов. Сюда же отнесены и те данные, которые существуют лишь несколько секунд — такие, как содержание телефонных разговоров или чатов по скайпу.
Сбор данных службами безопасности опирается на базовый тезис, что всю их массу можно проанализировать так, чтобы с ее помощью выявить связи между разными людьми. Разбираясь в этих связях, можно найти зацепки для следственных действий.
Главный принцип в обработке данных — снабжение каждого фрагмента меткой, и на основе этих метаданных компьютерные алгоритмы смогут выявлять интересующие службу безопасности связи. Метаданные — это данные, описывающие другие данные. Таковы, к примеру, имена и размеры файлов на вашем компьютере. В цифровом мире этикетка, наклеенная на фрагмент данных, будет называться меткой. Снабжение данных меткой — это обязательный первый шаг в их обработке, поскольку именно метка позволяет аналитику (или его программе) классифицировать и организовывать имеющуюся информацию для ее дальнейшей обработки и анализа. Метки позволяют совершать манипуляции с фрагментами данных, не вникая в их содержание. Это очень важный юридический момент в работе службы безопасности, поскольку закон США не позволяет вскрывать переписку граждан США, равно как и иностранцев, пребывающих в стране на законных основаниях, без соответствующего ордера.
Компания IDC, занимающаяся анализом данных, сообщает, что только 3% всей информации, циркулирующей в компьютерном мире, при создании сопровождается присвоением какой-либо метки. Поэтому АНБ использует особую, весьма сложную программу, которая на всю собранную информацию «наклеивает» соответствующие метки. Они представляют собой основу для любой системы, устанавливающей связи между различными видами данных — например, между видеофайлами, документами и записями телефонных разговоров. Скажем, система обработки данных может привлечь внимание следствия к подозреваемому, который вывешивает в сети террористическую пропаганду, посещает сайты, где описана технология изготовления самодельных взрывных устройств, и вдобавок покупает скороварку. (Эта схема соответствует поведению братьев Царнаевых, которых обвиняют в теракте на Бостонском марафоне.) Подобная тактика основывается на предположении, что террористов отличают специфические профили данных, хотя многие эксперты ставят это предположение под сомнение.