Лицевой счет
«Усы, лапы и хвост — вот мои документы». Сегодня заявление кота Матроскина звучит не так уж комично. С недавних пор «лицом» можно оплатить проход на любую станцию московской подземки. О системах распознавания лиц «Цифровой океан» поговорил с компанией-разработчиком VisionLabs, технологическим партнером столичной подземки
На самом деле, машины давно узнают москвичей в лицо. Инструменты видеонаблюдения с распознаванием лиц стали устанавливать в метро еще в середине 2010-х, но использовались они только полицией. Камеры системы безопасности «Сфера» можно встретить при входе на станцию и на выходе, на платформе и в вагоне поезда. По данным правоохранителей, ежемесячно они помогают задерживать несколько сотен преступников, сопоставляя их изображения с фотографиями из базы лиц, находящихся в розыске.
Однако эти данные закрыты от посторонних. «Поэтому для оплаты проезда в метро через FacePay используется собственная база биометрии», — рассказал нам Дмитрий Марков, глава компании VisionLabs, разработавшей алгоритмы распознавания лиц для новой системы. Пассажиру, решившему перейти на новый и быстрый способ оплаты, требуется не только указать свои реквизиты в специальном приложении, но и сделать снимок лица, по которому система сможет его опознавать.
Первые камеры FacePay появились на станции «Октябрьское Поле» в 2019 году. К осени 2021 года к ней были подключены уже все 14 веток и 241 станция столичного метрополитена, готовится запуск системы на линиях МЦК и МЦД. Зарегистрированному пользователю достаточно встать на круглый черный стикер, приклеенный к полу перед турникетом, и прямо взглянуть в камеру. Проход занимает на пару секунд меньше, чем при использовании карты, и в пересчете на многомиллионный поток выигрыш оказывается весьма серьезным.
Знакомые лица
Самые первые опыты с машинным распознаванием лиц проводились в 1960-х в Техасском университете. И хотя до применения современных нейросетей было еще далеко, ключевые принципы были найдены уже тогда. Лицо на фотографии вручную размечали опорными точками, очерчивая положение глаз, носа и рта. Затем в работу вступали алгоритмы: они корректировали искажения, разворачивая лицо в стандартное положение, строго анфас, после чего сопоставляли координаты точек с данными из базы, которая в то время насчитывала лишь 800 снимков. Сегодня все эти задачи выполняют нейросети, а датасеты могут достигать объемов в сотни тысяч и миллионы лиц, но в целом подход остался прежним.
«На первом этапе нейросеть обнаруживает и вырезает из изображения лицо, детектирует на нем точки, число которых иногда переваливает за сотню, а также масштабирует и поворачивает снимок для дальнейшей обработки. На следующем шаге координаты всех опорных точек превращаются в одно векторное значение — дескриптор, нечто вроде „биометрической контрольной суммы“ лица, — объясняет Дмитрий Марков. — Использование дескриптора экономит вычислительные ресурсы. Его значение просто сопоставляется с сохраненными в базе дескрипторами ранее обработанных лиц: чем ближе совпадение, тем выше сходство. Кроме того, оно не позволяет восстановить по нему исходный портрет человека, защищая конфиденциальность».