Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не рокот космодрома Не рокот космодрома

Как и зачем строят космодромы

Популярная механика
В шутливой форме В шутливой форме

Настя Ивлеева стала суперзвездой инстаграма и комедийного жанра

Glamour
Как в кино Как в кино

Новые технологии в кино – динамически меняющийся фотореалистичный фон

ТехИнсайдер
Криптобанкиры Криптобанкиры

Мир буквально загипнотизирован блокчейном и криптовалютами

Forbes
Фальшивый Чаадаев Фальшивый Чаадаев

Популярный портрет гусара Чаадаева является старой фальшивкой

Дилетант
Охота на лидера Охота на лидера

Hyundai Sonata – Toyota Camry

АвтоМир
Александр Носик: В школах нас не учат жизни — а жаль Александр Носик: В школах нас не учат жизни — а жаль

Александр Носик — о своем распавшемся браке и смысле жизни

Караван историй
Фантастические твари и где они обитают Фантастические твари и где они обитают

Главный аниматор «Звездных войн» рассказывает, как придумал свинобегемота

Esquire
Я и мое благоустройство Я и мое благоустройство

О том, что бывает, когда вы доверяете государству все решать за вас

GQ
Это частная территория Это частная территория

Чем не стоит делиться с партнером

Cosmopolitan
Ультиматум Борнса Ультиматум Борнса

Американский певец Гарретт Борнс способен заворожить любую публику

Vogue
Бросок к славе Бросок к славе

Иван Колесников сыграл легенду баскетбола Александра Белова в новой драме

Vogue
Громче, чем бомбы Громче, чем бомбы

Светлана Лобода рассказала нам о планах, которые надо осуществить

Glamour
Татьяна Еремеева. Простая история Татьяна Еремеева. Простая история

История Татьяны Еремеевой об отношениях со Спартаком Мишулиным

Караван историй
Скромное обаяние рабства Скромное обаяние рабства

Рабство куда более сложное явление, чем можно подумать

Maxim
Хроника пикирующего Форда Хроника пикирующего Форда

GQ проводит время с Харрисоном Фордом

GQ
Алина Ланина: У Бога на все свои планы Алина Ланина: У Бога на все свои планы

Я хотела бы так — один раз и на всю жизнь

Караван историй
Все любят Дональда Все любят Дональда

Евгения Микулина оппонирует женщинам, которым омерзителен Трамп

GQ
Jaguar F-Type SVR Jaguar F-Type SVR

От одного лишь звука мотора мурашки по коже

Quattroruote
Однажды я так сильно заболела, что тут же выздоровела, или Грандиозный медицинский лохотрон Однажды я так сильно заболела, что тут же выздоровела, или Грандиозный медицинский лохотрон

Тема мошенничества в медицинском обслуживании далеко не нова

СНОБ
Татьяна Пекур, Яна Макарова, Егор Климович. Ее души на всех хватало Татьяна Пекур, Яна Макарова, Егор Климович. Ее души на всех хватало

О жизни народной артистки СССР Галины Макаровой рассказывают её дочь и внуки

Караван историй
Зачем нужны дорогие лекарства Зачем нужны дорогие лекарства

Цена на препарат сама по себе способна исцелить больного

СНОБ
Несбывшаяся кадриль Несбывшаяся кадриль

Каменный особняк и судьбы двух необыкновенных женщин, посвятивших жизнь танцу

Караван историй
«Мучительница и душегубица» «Мучительница и душегубица»

Дело помещицы Салтыковой

Дилетант
Саша Щипин: Смерть автора Саша Щипин: Смерть автора

«Слишком свободный человек» биография Бориса Немцова о новейшей истории России

СНОБ
Выйти из сумрака Выйти из сумрака

По оценке ВОЗ, от депрессии страдают более 300 млн человек во всем мире

Добрые советы
На чью мельницу текут мозги На чью мельницу текут мозги

Международные миграции ученых наводят на любопытные выводы

СНОБ
«Пуповину он резать отказался». Россияне о партнерских родах «Пуповину он резать отказался». Россияне о партнерских родах

«Пуповину он резать отказался». Россияне о партнерских родах

СНОБ
Потерять ребенка Потерять ребенка

Истории, в которых матери потеряли своих детей

СНОБ
Текст Конституции шипит на утюге. Об основном проекте Уральской индустриальной биеннале Текст Конституции шипит на утюге. Об основном проекте Уральской индустриальной биеннале

Как художники раскрыли в своих работах понятие «Новая грамотность»

СНОБ
Открыть в приложении