На лице написано

Алгоритмы распознавания лиц понемногу превращаются во всевидящее око

Популярная механикаHi-Tech

На лице написано

Взять кредит, оформить визу, да и просто запустить смартфон последней модели – сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам – на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Текст: Александр Ершов, Роман Фишман

0:00 /
786.027

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во-первых, найти лицо на снимке (если оно там есть), во-вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее – с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола – Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, – он устроен удивительно просто. Вы даже не поверите насколько.

Алгоритмы распознают образы

Почему это работает? Посмотрите на признак [1]. Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак [2]: светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Шаг 1. Убираем цвет и превращаем изображение в матрицу яркости.
Шаг 2. Накладываем на нее одну из квадратных масок – они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет – забываем про нее, здесь лица нет.
Шаг 4. Повторяем с шага 2 уже с новой маской – но только в той области изображения, которая прошла первое испытание.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма – в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ»). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 × 64 пикселя может быть огромное количество – (28)64 × 64 = 232768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача – свести конкретное изображение к набору особенностей.

Шаг 1. Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Одна на всех Романовых Одна на всех Романовых

Матильда Кшесинская прожила долгую и счастливую жизнь

Дилетант, январь'18
Бриллиантовых кровей Бриллиантовых кровей

Арт-директор Dior Joaillerie Виктуар де Кастеллан дает одно интервью ELLE

Elle, декабрь'17
Упасть по собственному желанию Упасть по собственному желанию

Альпинисты боятся сорваться, а роупджамперы идут в горы специально за этим

Популярная механика, декабрь'17
Honda CR-V – Toyota RAV4 Honda CR-V – Toyota RAV4

Молодые конкуренты, такие, как свежий Honda CR-V, вполне могут потеснить лидера

АвтоМир, ноябрь'17
Летающий автомобиль Атаманова Летающий автомобиль Атаманова

Пятиместный автомобиль, первый полет которого планируется уже в сентябре

Популярная механика, январь'18
Собрано в России Собрано в России

Мужчина года — Федор Бондарчук

Glamour, декабрь'17
Лыжники с небес Лыжники с небес

Самолеты на лыжах, пожалуй, еще большая экзотика, чем гидросамолеты

Популярная механика, декабрь'17
12 лучших авто года по версии GQ 12 лучших авто года по версии GQ

Дюжина лучших автомобилей года

GQ, декабрь'17
Сверх человек: бета-версия Сверх человек: бета-версия

Биохакеры пытаются редактировать гены при помощи собственных изобретений

Esquire, июль'18
Как выбрать противовирусное средство? Как выбрать противовирусное средство?

Как не ошибиться в выборе препаратов

Лиза, ноябрь'17
Неудержимая Неудержимая

Светлана Лебедева не любит мелочиться: если уж бороться, то сразу с пятерыми

Maxim, март'18
Коллективное хозяйство Коллективное хозяйство

У «Куйбышевазот» нет контролирующего акционера, но есть главный

Forbes, декабрь'17
Длинные руки «Буяна» Длинные руки «Буяна»

В 2015 году мы узнали, что наносить ракетные удары можно из Каспийского моря

Популярная механика, июнь'18
Читаем в ноябре: выбор Psychologies Читаем в ноябре: выбор Psychologies

Хотите разобраться в своих чувствах, наладить отношения с близкими и просто получить удовольствие? Начните с лучших книжных новинок месяца по версии Psychologies.

Psychologies, ноябрь'17
Со всей возможной любовью Со всей возможной любовью

Александр Цыпкин о письмах фанаток и планах на будущее

Glamour, декабрь'17
Coverstory Coverstory

Мы предложили Полине Гагариной сняться бритой наголо и ответить на блиц-опрос

SNC, декабрь'17
Охота на лидера Охота на лидера

Hyundai Sonata – Toyota Camry

АвтоМир, ноябрь'17
12 новогодних конфликтов и способы их избежать 12 новогодних конфликтов и способы их избежать

Почему-то именно перед праздниками мы ссоримся особенно часто

Домашний Очаг, декабрь'17
Осмелиться на яркий жест: почему мы боимся яркого макияжа? Осмелиться на яркий жест: почему мы боимся яркого макияжа?

Синие тени, зеленые ресницы, алые губы… Не каждая девушка решится на такое буйство красок, хотя оно сейчас в моде. Почему же, несмотря на уговоры визажистов, мы с осторожностью относимся к яркому макияжу и стесняемся даже красной помады?

Psychologies, ноябрь'17
Через тернии к реальности Через тернии к реальности

230 лет назад родился Луи Дагер, лишивший художников монополии на реальность

GEO, декабрь'17
Хью Джекман Хью Джекман

Хью Джекман возвращается к истокам. Мировая премьера мюзикла «Величайший шоумен»

L’Officiel, декабрь'17
Самые странные летающие существа Самые странные летающие существа

Новые палеонтологические находки меняют сложившиеся представления о птерозаврах

National Geographic, ноябрь'17
Долгое утро Долгое утро

Аня Старшенбаум: «Я снимусь, но с условием: это будет эротическая фотосессия!»

Maxim, декабрь'17
«Я не девочка с «биполяркой»: проект фотографа Лизы Жаковой «Я не девочка с «биполяркой»: проект фотографа Лизы Жаковой

Лиза Жакова недавно опубликовала фотопроект «Нам не кажется», посвященный депрессии и биполярному расстройству личности. В интервью Psychologies.ru она рассказала о том, как живет с этими диагнозами, почему не хочет ассоциировать с ними свое творчество, что не так с флешмобом #faceofdepression, и о многом другом.

Psychologies, ноябрь'17
Осторожно, Нагиев Осторожно, Нагиев

Как Дмитрий Нагиев стал одним из главных шоуменов страны и моделью для мужчин

GQ, декабрь'17
Громче, чем бомбы Громче, чем бомбы

Женщина года — Светлана Лобода

Glamour, декабрь'17
Куда приводят мечты Куда приводят мечты

Практики формирования намерения

Yoga Journal, декабрь'17
Зеленый сигнал Зеленый сигнал

Семья бизнесменов строит один из крупнейших жестких дискаунтеров «Светофор»

Forbes, декабрь'17
3 простых способа избежать тоски в холодное время года 3 простых способа избежать тоски в холодное время года

Осень и зима в городе — унылое время, когда легко скатиться в хандру. Но эмоции не вводятся в организм снаружи, а исходят изнутри. Как научиться лучше понимать себя и управлять собственным восприятием, чтобы избавиться от тоски и сохранить бодрое настроение?

Psychologies, ноябрь'17
Ольга Кормухина: Нужно научиться ждать Ольга Кормухина: Нужно научиться ждать

В преддверии концертов мы поговорили с певицей о русском роке и путешествиях

Лиза, ноябрь'17
Открыть в приложении