Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кофе во время беременности не нарушил нервно-психическое развитие детей Кофе во время беременности не нарушил нервно-психическое развитие детей

Употребление кофе во время беременности не связано с нарушениями у детей

N+1
«Хотим быть как она». Двойники Адель повально начали худеть «Хотим быть как она». Двойники Адель повально начали худеть

Трибюьт-актрисы начали избавляться от веса, чтобы сохранить сходство с Адель

Cosmopolitan
Синяя акула выжила с пробитой меч-рыбой головой Синяя акула выжила с пробитой меч-рыбой головой

Первый случай, когда синюю акулу пронзила меч-рыба, и она выжила

N+1
Трактор от А до Я: из чего состоит, как работает и для чего на самом деле нужен Трактор от А до Я: из чего состоит, как работает и для чего на самом деле нужен

Как устроены и почему так ценятся современные тракторы

Популярная механика
«Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году «Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году

Пять тенденций в сфере знакомств, которые будут актуальны в 2025 году

Psychologies
Flying Phantom: невероятные яхты, которые летят по волнам Flying Phantom: невероятные яхты, которые летят по волнам

Катамараны Flying Phantom стремительно ворвались в парусный спорт

Популярная механика
Как похудела Ирина Пегова: строгие правила и много-много воды Как похудела Ирина Пегова: строгие правила и много-много воды

Как Ирина Пегова превратилась из очаровательной пышки в изящную нимфу

Cosmopolitan
LinkedIn для медиков: как стартап Н1 привлек $100 млн и собрал онлайн-данные о врачах LinkedIn для медиков: как стартап Н1 привлек $100 млн и собрал онлайн-данные о врачах

Компания собрала информацию о 10 млн врачей по всему миру и заработала на этом

Forbes
Почему Россия не стремится защищать Армению от азербайджанского вторжения Почему Россия не стремится защищать Армению от азербайджанского вторжения

Нельзя защищать тех, кто сделал все, чтобы сдать свои территории

СНОБ
«Моя сестра притворилась беременной, чтобы вернуть бывшего» «Моя сестра притворилась беременной, чтобы вернуть бывшего»

На что только не идут некоторые женщины, чтобы снова сойтись с партнером

Psychologies
«Купил Кайен, а на ОСАГО денег нет». Кто раздражает инспекторов ГИБДД «Купил Кайен, а на ОСАГО денег нет». Кто раздражает инспекторов ГИБДД

Что раздражает инспекторов ГИБДД на дороге и как отучить автомобилистов нарушать

РБК
Почему североамериканские спецслужбы ежегодно следят за Санта Клаусом? Почему североамериканские спецслужбы ежегодно следят за Санта Клаусом?

Откуда взялась традиция «отслеживать Санту» в США?

Популярная механика
Железная леди в бархатной перчатке: история девушки-Геркулеса Джоан Роудс Железная леди в бархатной перчатке: история девушки-Геркулеса Джоан Роудс

История самой гламурной женщины-силачки Великобритании

Cosmopolitan
Можно ли собрать пушку Гаусса своими руками: силовая установка Можно ли собрать пушку Гаусса своими руками: силовая установка

Пистолет Гаусса – это самое серьезное оружие, которое мы когда-либо строили

ТехИнсайдер
Осенняя хандра или депрессия: как отличить? Осенняя хандра или депрессия: как отличить?

Осенняя хандра — абсолютно нормальный процесс, свойственный многим людям

Psychologies
Горячие закуски на скорую руку: простые мужские рецепты Горячие закуски на скорую руку: простые мужские рецепты

Простые мужские блюда, которые ты легко сможешь повторить

Maxim
Арендаторы хотят комфорта Арендаторы хотят комфорта

Всплеск цен на аренду жилья вызван отложенным спросом и сезонной активностью

Эксперт
«Hot Wheels словно акции»: коллекционеры тратят десятки тысяч долларов, чтобы купить всего одну игрушечную машинку «Hot Wheels словно акции»: коллекционеры тратят десятки тысяч долларов, чтобы купить всего одну игрушечную машинку

Чья коллекция Hot Wheels вошла в «Книгу рекордов Гиннесса»?

VC.RU
Как проверить авто на залог: все возможные способы и инструкции Как проверить авто на залог: все возможные способы и инструкции

Как проверить автомобиль перед покупкой и случайно не взять на себя обременения?

РБК
Секс-гайд по квартире: 5 лучших локаций для того, чтобы заняться любовью Секс-гайд по квартире: 5 лучших локаций для того, чтобы заняться любовью

Попробуем больше раскрыть "сексуальный потенциал" твоей квартиры

Playboy
Как выстроить привычку за несколько шагов, опираясь на науку? Как выстроить привычку за несколько шагов, опираясь на науку?

С чего начать, какую стратегию выбрать, чтобы выстроить привычку?

Популярная механика
Карта Сан-Франциско на шести кассетах: чем пользовались водители для навигации до GPS Карта Сан-Франциско на шести кассетах: чем пользовались водители для навигации до GPS

Краткая история первых навигационных систем — в пересказе Ars Technica

VC.RU
Русская музыка: подкаст о главных именах современной академической сцены Русская музыка: подкаст о главных именах современной академической сцены

Героями первого выпуска подкаста стали Марина Полеухина и Александр Чернышков

СНОБ
11 возможных причин того, что вы все еще одна 11 возможных причин того, что вы все еще одна

У того, что вы пока не в отношениях, есть весомая причина

Psychologies
Лонжерон: для чего нужен, как ремонтируют и другие нюансы Лонжерон: для чего нужен, как ремонтируют и другие нюансы

Нужно ли усиливать лонжероны, где они находятся, что делать в случае поломки?

РБК
Как открыть бизнес с родственниками и не разрушить семью Как открыть бизнес с родственниками и не разрушить семью

Семейный бизнес — отличная идея или полный провал?

GQ
Человечество на диете: почему наши попытки сбросить вес терпят поражение Человечество на диете: почему наши попытки сбросить вес терпят поражение

Отрывок из книги Германа Понцера «Sapiens на диете»

Forbes
PodRide: самый крутой электробайк или самый странный электромобиль PodRide: самый крутой электробайк или самый странный электромобиль

"Электрокар" весом в 70 кг имеет гибридную схему: в нем есть педали и мотор

CHIP
Ничего личного: что делать, если отношения с боссом вышли за грань деловых Ничего личного: что делать, если отношения с боссом вышли за грань деловых

Как напомнить боссу о личном пространстве, не лишившись должности

Cosmopolitan
Скандал разгорается: стало известно, из чего состоит поддельное мясо тунца в сэндвичах Subway Скандал разгорается: стало известно, из чего состоит поддельное мясо тунца в сэндвичах Subway

Subway обманывала своих клиентов, которые отказывались от мяса?

Популярная механика
Открыть в приложении