На лице написано: как работает компьютерное распознавание лиц

Многое сегодня невозможно без участия алгоритмов распознавания лиц

Популярная механикаHi-Tech

На лице написано: как работает компьютерное распознавание лиц

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Роман Фишман, Александр Ершов

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

1. Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

ba5e6a0f3de8e9d79670798638761cd6.jpg
  1. Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
  2. Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
  3. Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
  4. Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом. Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

2. Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Земля переезжает Земля переезжает

Когда Солнце начнет затухать, корабль «Земля» уже прибудет к новой звезде

Популярная механика
BMW X5 Diamond. Не такой, как у всех BMW X5 Diamond. Не такой, как у всех

BMW X5 Diamond – эксклюзивный, мощный и статусный автомобиль

4x4 Club
Самые смертельные пандемии от доисторических времен до XXI века Самые смертельные пандемии от доисторических времен до XXI века

Самые страшные заболевания в истории

Maxim
7 блюд из гречки: что делать со скупленной крупой 7 блюд из гречки: что делать со скупленной крупой

Семь разнообразных блюд, которые сделают из тебя гуру гречки

Cosmopolitan
10 самых здоровых стран мира 10 самых здоровых стран мира

Мы ждем лета, чтобы снова путешествовать по нашим любимым странам

GQ
Смерть на топе. Почему Екатерина Диденко пошла к Малахову, еще не похоронив мужа Смерть на топе. Почему Екатерина Диденко пошла к Малахову, еще не похоронив мужа

Новые мерцающие границы допустимого в новом мире персональных видеоблогов

СНОБ
Без пробуксовки Без пробуксовки

Немецкие автоконцерны намерены продолжить инвестировать в российский рынок

РБК
Несносные боссы Несносные боссы

Пять типов руководителей, с которыми лучше вообще не оказываться в одном офисе

Cosmopolitan
Тайна форсажного пламени Тайна форсажного пламени

Что такое форсаж?

Популярная механика
Правила жизни Кристофера Уокена Правила жизни Кристофера Уокена

Правила жизни актера Кристофера Уокена

Esquire
Россия скинула сверх ожиданий Россия скинула сверх ожиданий

Москва и Минск договорились о цене на нефть

РБК
Провокатор, бунтарь и ловелас: каким мы запомним Эдуарда Лимонова Провокатор, бунтарь и ловелас: каким мы запомним Эдуарда Лимонова

За что современники уважали и ценили писателя Эдуарда Лимонова

Cosmopolitan
6 сериалов, которые смотрятся на карантине за один день 6 сериалов, которые смотрятся на карантине за один день

Лучшие короткие сериалы с рейтингом не менее 8 из 10

Популярная механика
Твое тело – твое дело Твое тело – твое дело

Бодипозитив – это история о любви и принятии

Cosmopolitan
Девушка похудела на 30 кг из мести парню, отменившему свидание в день рождения Девушка похудела на 30 кг из мести парню, отменившему свидание в день рождения

24-летняя жительница Уэльса Лори Болл получила неожиданный удар от парня

Cosmopolitan
Stratolaunch представила гиперзвуковые планеры и многоразовый космоплан Stratolaunch представила гиперзвуковые планеры и многоразовый космоплан

Компания планировала запускать спутники на орбиту, но сменила курс развития

N+1
Вертикаль страсти Вертикаль страсти

В съемке для Vogue главные героини российского современного танца

Vogue
Оскорбленные сочувствием Оскорбленные сочувствием

Нам, миру, хотели сообщить, что родился великий американский роман

Огонёк
Как мшанки прожили на Земле 500 миллионов лет: секрет долголетия Как мшанки прожили на Земле 500 миллионов лет: секрет долголетия

Какие эволюционные приобретения помогли мшанкам прожить на Земле много лет

Популярная механика
Макс фон Сюдов скончался в возрасте 90 лет Макс фон Сюдов скончался в возрасте 90 лет

Вспоминаем, как Ингмар Бергман открыл нам Сюдова

GQ
Думать меньше — успевать больше Думать меньше — успевать больше

Каждый хоть раз мечтал о лишнем часе в сутках

Psychologies
Что за папка Windows.old, и зачем она нужна? Что за папка Windows.old, и зачем она нужна?

Эта папка может весить несколько гигабайт и занимать много места на диске

CHIP
6 финансовых привычек, которыми стоит обзавестись до 30 лет 6 финансовых привычек, которыми стоит обзавестись до 30 лет

Пренебрежение финансовым здоровьем может привести нас в неприятные ситуации

Playboy
Непроницаемость графена опровергли водородом Непроницаемость графена опровергли водородом

Вещество одноатомной толщины не пропускает ничего, кроме водорода

N+1
«Свет мой, зеркальце»: как научиться принимать свою внешность «Свет мой, зеркальце»: как научиться принимать свою внешность

Исправление своих индивидуальных особенностей не всегда делает нас счастливыми

Psychologies
Внимание: опасность! 8 мест, где не стоит расплачиваться банковской картой Внимание: опасность! 8 мест, где не стоит расплачиваться банковской картой

Безналичная оплата стала явлением распространенным, но не всегда безопасным

Домашний Очаг
От холопа до Магомаева: кто такой Милош Бикович и почему все о нем говорят От холопа до Магомаева: кто такой Милош Бикович и почему все о нем говорят

Милош Бикович в одночасье стал одним из ведущих актеров России

Cosmopolitan
Неувольняемые: кому всегда будут платить миллионы на рынке труда Неувольняемые: кому всегда будут платить миллионы на рынке труда

Навыки продуктивного нетворкинга станут ключевым преимуществом в бизнесе

Forbes
Любовь, потери и затворничество. Личная драма Елены Прокловой Любовь, потери и затворничество. Личная драма Елены Прокловой

Судьба имела на юную Елену Проклову свои планы

Cosmopolitan
Как создать модный интернет-магазин, разрушая «нормы приличия» Как создать модный интернет-магазин, разрушая «нормы приличия»

Без отчаянного «авангарда» в ассортименте нельзя создать модный интернет-магазин

Forbes
Открыть в приложении