Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Происхождение вкусов: Как любовь к еде сделала нас людьми» «Происхождение вкусов: Как любовь к еде сделала нас людьми»

Как мозг запоминает и классифицирует запахи

N+1
«Локомотивом сближения может стать «зеленая» энергетика» «Локомотивом сближения может стать «зеленая» энергетика»

Тадзио Шиллинг о перспективах энергетического сотрудничества России и ЕС

РБК
Городские острова тепла вдвое снизили смертность людей из-за холода Городские острова тепла вдвое снизили смертность людей из-за холода

Городской остров тепла снижает смертность населения от холода на 51,5 процента

N+1
Как выбрать нишу в закупках. Инструкция для начинающих Как выбрать нишу в закупках. Инструкция для начинающих

Почему ошибка при выборе ниши и контрагента в закупках чревата большими убытками

Inc.
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
5 ошибок Дмитрия Федорова, основателя сервиса по доставке еды Catery 5 ошибок Дмитрия Федорова, основателя сервиса по доставке еды Catery

Основатель сервиса Catery — об ошибках, которые мешали его бизнесу развиваться

Inc.
Муаровая сверхрешетка помогла настроить спин атома железа Муаровая сверхрешетка помогла настроить спин атома железа

Электронными и спиновыми свойствами атомов железа можно управлять

N+1
Говори или проиграешь: как убедить любого в чем угодно — советы бывшего секретного агента Говори или проиграешь: как убедить любого в чем угодно — советы бывшего секретного агента

Отрывок из книги Эви Пумпурас о том, как научиться убеждать

Inc.
Железная ферма Сэма Дила: необычные скульптуры Железная ферма Сэма Дила: необычные скульптуры

Живет в жаркой австралийской глубинке веселый человек по имени Сэм Дил

Популярная механика
Как продавцу обезопасить свой бренд при сотрудничестве с маркетплейсом Как продавцу обезопасить свой бренд при сотрудничестве с маркетплейсом

Плюсы и минусы работы с маркетплейсами для продавцов

Inc.
Мой, но не распаривай: дерматолог раскрыл неожиданные ошибки в уходе за кожей Мой, но не распаривай: дерматолог раскрыл неожиданные ошибки в уходе за кожей

Все иногда совершают эти бьюти-грехи

Cosmopolitan
Как ученые искали темную материю на Земле: пространственные искажения Как ученые искали темную материю на Земле: пространственные искажения

Ученые попробовали вычислить загадочное вещество с помощью атомных часов

Популярная механика
А ты умеешь? Как правильно ходить – объясняет эксперт А ты умеешь? Как правильно ходить – объясняет эксперт

Оказывается, ходить нужно не только много и часто, но и правильно

VOICE
Как выбрать зимние шины: 5 важных советов для тех, кто еще не переобулся Как выбрать зимние шины: 5 важных советов для тех, кто еще не переобулся

Когда переобуваться, как подобрать модель шин и нужный размер?

РБК
Майнинг: что это, как работает и для чего используется Майнинг: что это, как работает и для чего используется

основные принципы майнинга, что это такое и как все работает

CHIP
Может ли зимой начаться гроза Может ли зимой начаться гроза

Почему гроза может начаться в любое время года, даже зимой?

Популярная механика
Протеиновые коктейли: научные факты «за» и «против» Протеиновые коктейли: научные факты «за» и «против»

Протеиновые коктейли в целом безвредны, но нужны далеко не каждому

РБК
Что такое суперизвержение: как один вулкан может вызвать катастрофу планетарного масштаба Что такое суперизвержение: как один вулкан может вызвать катастрофу планетарного масштаба

Как одно сверхизвержение вулкана может катастрофически повлиять на климат?

Популярная механика
«Карандаш в стакане»: пять страшилок, которыми пугают женщин за 40 «Карандаш в стакане»: пять страшилок, которыми пугают женщин за 40

Чем мужчины любят пугать женщин, возраст которых перевалил за 40

Cosmopolitan
Соединить экологию с экономикой Соединить экологию с экономикой

Как принципы ESG могут изменить современное производство

РБК
Марина Жигалова: «Сплоченность команды Independent Media — наша сила» Марина Жигалова: «Сплоченность команды Independent Media — наша сила»

Интервью с предпринимательницей Мариной Жигаловой о современных СМИ

Cosmopolitan
5 привычек, от которых давно пора избавиться 5 привычек, от которых давно пора избавиться

Эти привычки «тормозят» вас и не дают развиваться

Psychologies
Анна Павлова: как русская балерина превратилась в десерт Анна Павлова: как русская балерина превратилась в десерт

Кто придумал десерт «Павлова» и причем здесь балет?

Cosmopolitan
Красавица и олигарх: 7 пар с большой разницей в возрасте Красавица и олигарх: 7 пар с большой разницей в возрасте

Олигархи, которые связали свою жизнь с юными красавицами

Cosmopolitan
5 ошибок, за которые стоит себя простить 5 ошибок, за которые стоит себя простить

Важно признать свои ошибки и простить себя за них

Psychologies
Ирина Хакамада: «Полезно нырнуть на самую глубину отчаяния» Ирина Хакамада: «Полезно нырнуть на самую глубину отчаяния»

Хакамада меняется в каждом отрезке времени. Сейчас у нее очень непростой период

Psychologies
Американский биотех-стартап выходцев из России привлек $2,5 млн от Xploration Capital Американский биотех-стартап выходцев из России привлек $2,5 млн от Xploration Capital

Стартап Longevica привлек $2,5 млн от венчурного фонда Xploration Capital

Forbes
Правило № 68: Ребята, надо верить в чудеса Правило № 68: Ребята, надо верить в чудеса

Коуч Алексей Ситников объясняет, как выдать безумные фантазии за бизнес

Tatler
Кейс LASERWAR: как запустить производство игрушечных винтовок в Смоленске и наладить экспорт в 75 стран Кейс LASERWAR: как запустить производство игрушечных винтовок в Смоленске и наладить экспорт в 75 стран

Как братья изучили лазертаг от и до и открыли производство игровых винтовок

Inc.
Сверхпроводящие линии передач: как это сделано в России Сверхпроводящие линии передач: как это сделано в России

Как в России создают сверхпроводящие линии электропередач

Популярная механика
Открыть в приложении