Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пламенные моторы будущего Пламенные моторы будущего

Интервью с генеральным директором ЦИАМ Михаилом Гординым

Популярная механика
Range Rover Velar Range Rover Velar

Невиданное прежде сочетание внедорожных способностей и драйва на асфальте

Quattroruote
Космические Одиссеи Космические Одиссеи

Русский милиционер и американский двоечник провели на орбите Земли почти год

Esquire
Рецидевицы Рецидевицы

Подруги твоей девушки могут представлять реальную угрозу вашим отношениям

Maxim
Лыжники с небес Лыжники с небес

Самолеты на лыжах, пожалуй, еще большая экзотика, чем гидросамолеты

Популярная механика
Хватит капризничать! Хватит капризничать!

Что делать с проявлением детских негативных эмоций

Лиза
Летающий автомобиль Атаманова Летающий автомобиль Атаманова

Пятиместный автомобиль, первый полет которого планируется уже в сентябре

Популярная механика
Чтим Каран Чтим Каран

С легендарной Донной Каран мы встречаемся в шоу-руме Urban Zen

L’Officiel
Полет бумеранга Полет бумеранга

Гибрид самолета, вертолета, конвертоплана и автожира

Популярная механика
Проект под ключ Проект под ключ

Белла Торн — новая фаворитка Ксавье Долана

GQ
7 знаменитых врачей Античности и Средневековья 7 знаменитых врачей Античности и Средневековья

Знаменитые врачи, спасавшие пациентов во времена Античности и Средневековья

Дилетант
“Страсть должна не сжигать, а питать” “Страсть должна не сжигать, а питать”

Психоаналитик Андрей Россохин предостерегает против крайностей

Psychologies
Без рулей и элеронов Без рулей и элеронов

Можно ли обойтись без таких привычных элементов самолета, как рули и элероны?

Популярная механика
Жили и жили Жили и жили

Век революции в портретах человека, дома, города

Русский репортер
Как полюбить себя, приняв свое тело Как полюбить себя, приняв свое тело

Мы не можем любить и быть любимыми, пока не научимся принимать себя. Не так просто убрать фальшивые маски, принять своих близких и найти тех, кто ценит нас такими, какие мы есть. Как научиться любить себя или вернуть эту любовь, если она была потеряна?

Psychologies
Как полюбить зиму: секреты из Норвегии Как полюбить зиму: секреты из Норвегии

Холод и ветер, сугробы и гололед, короткий световой день и постоянный риск подхватить простуду. Казалось бы, зимой не так много поводов для радости. Однако в Норвегии, где климат еще суровее, большинство людей счастливы. Как они научились получать удовольствие от зимы?

Psychologies
Nissan Juke – Renault Kaptur Nissan Juke – Renault Kaptur

Один из бестселлеров Renault и вернувшийся на российский рынок кроссовер Nissan

АвтоМир
Чемоданное настроение Чемоданное настроение

Куда поехать на зимние каникулы?

Psychologies
Самые странные летающие существа Самые странные летающие существа

Новые палеонтологические находки меняют сложившиеся представления о птерозаврах

National Geographic
Аж вся светится Аж вся светится

Трендсеттер года — Лукерья Ильяшенко

Glamour
Так ли надежна биометрия? Так ли надежна биометрия?

Можно ли обойти проверку отпечатков пальцев или сканирование глаза?

CHIP
Хью его знает Хью его знает

Артемий Троицкий — о своем самом знаменитом начальнике Хью Хефнере

GQ
Криптобанкиры Криптобанкиры

Мир буквально загипнотизирован блокчейном и криптовалютами

Forbes
Чемоданное настроение: куда поехать на зимние каникулы? Чемоданное настроение: куда поехать на зимние каникулы?

Длинные праздники – отличный повод сбавить темп, сменить обстановку и набраться впечатлений на несколько месяцев вперед. Осталось только решить, где это сделать.

Psychologies
Где мои подарки? Где мои подарки?

Праздник – это подарки, но что делать, если их становится слишком много?

Домашний Очаг
Топ-5 лайфхаков перед сном Топ-5 лайфхаков перед сном

Следуя этим советам, ты можешь «навести красоту» еще с вечера

Лиза
Читаем в ноябре: выбор Psychologies Читаем в ноябре: выбор Psychologies

Хотите разобраться в своих чувствах, наладить отношения с близкими и просто получить удовольствие? Начните с лучших книжных новинок месяца по версии Psychologies.

Psychologies
Живучие не по правилам – 2 Живучие не по правилам – 2

Новая порция историй о реальных людях, выживших в катастрофических ситуациях

Maxim
Фантастические твари и где они обитают Фантастические твари и где они обитают

Главный аниматор «Звездных войн» рассказывает, как придумал свинобегемота

Esquire
Танго надежды: наперегонки с болезнью Танго надежды: наперегонки с болезнью

Танцевать на инвалидной коляске — это вызов. Вызов болезни, судьбе. Это решение, которое требует смелости. И Наталье Боровой ее не занимать. К тяжелому диагнозу можно отнестись по-разному. Кто-то ставит крест на прежней жизни и отдается во власть недуга. Кто-то старается принять болезнь, «договориться» с ней. Наталья видит в своем диагнозе хитрого соперника, с которым упрямо соревнуется уже несколько лет. Об отчаянной игре на опережение ее личная история.

Psychologies
Открыть в приложении