Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

В турецкой пещере нашли практически целую корзину позднего бронзового века В турецкой пещере нашли практически целую корзину позднего бронзового века

Археологи обнаружили в турецкой пещере Инёню практически целую древнюю корзину

N+1
«Спасение от стресса»: Меган Маркл помогла Адель пережить развод и похудеть «Спасение от стресса»: Меган Маркл помогла Адель пережить развод и похудеть

Герцогиня Сассекская стала источником вдохновения для Адель

Cosmopolitan
Открывая космос Открывая космос

Путеводитель женщины-астронавта по миру миссий, чудес и перемен в космосе

kiozk originals
Как собрать вокруг себя карьерных единомышленников Как собрать вокруг себя карьерных единомышленников

Как собрать вокруг себя крепкую и эффективную команду?

GQ
Как путешествовать по миру на 50 долларов в день Как путешествовать по миру на 50 долларов в день

Платите меньше, путешествуйте дольше, действуйте с умом

kiozk originals
Оно тебе НАDО (но это не точно) Оно тебе НАDО (но это не точно)

Самые необычные сексшоп-тренды

Playboy
Секс или самовыражение? Что такое кинки-пати — разбираемся подробно Секс или самовыражение? Что такое кинки-пати — разбираемся подробно

Kinky party — что это такое, как и где происходит?

Cosmopolitan
50 вопросов, которые помогут построить более глубокие отношения 50 вопросов, которые помогут построить более глубокие отношения

О чем небанальном спросить знакомого, чтобы стать ближе?

Psychologies
Тургенев, Vogue, сладости: странности и чудачества Федора Достоевского Тургенев, Vogue, сладости: странности и чудачества Федора Достоевского

Странные факты о Федоре Достоевском, которых вы не знали

Esquire
Чек-лист: проверь, готов ли твой автомобиль к зиме Чек-лист: проверь, готов ли твой автомобиль к зиме

Давай еще раз пройдемся по пунктам и проверим, готов ли твой автомобиль к зиме

Maxim
Может ли зимой начаться гроза Может ли зимой начаться гроза

Почему гроза может начаться в любое время года, даже зимой?

Популярная механика
Рома Штайн «Не хочу в эту кабалу!» Рома Штайн «Не хочу в эту кабалу!»

Певец и блогер Рома Штайн — что можно считать настоящей музыкой?

ЖАРА Magazine
Утюг, отпариватель или парогенератор – что выбрать для дома? Утюг, отпариватель или парогенератор – что выбрать для дома?

Что лучше – отпариватель или парогенератор для одежды?

CHIP
«Черная пятница» в разгаре: что покупают россияне и в чем подвох «Черная пятница» в разгаре: что покупают россияне и в чем подвох

Краткая занимательная статистика «Черной пятницы» в России

Playboy
Лучшие игрушки в СССР — железные дороги и модели из ГДР Лучшие игрушки в СССР — железные дороги и модели из ГДР

Рассказываем, на что спускали все деньги советские мальчики

Maxim
Перезагрузка Перезагрузка

Удалось ли вернуть к жизни сериал "Декстер" после восьмилетнего забвения

Esquire
Беспроигрышная лотерея Беспроигрышная лотерея

Зачем аналитики и экономисты делают неверные прогнозы и не останавливаются

Forbes
Мир моды плачет! Дизайнер Вирджил Абло умер в 41 год: каким мы его запомним Мир моды плачет! Дизайнер Вирджил Абло умер в 41 год: каким мы его запомним

История Вирджила Абло: как парень из семьи эмигрантов стал известным дизайнером?

Cosmopolitan
Павел Антокольский Павел Антокольский

Поэт Павел Антокольский глазами Дмитрия Быкова

Дилетант
Без инстаграма не разберешься Без инстаграма не разберешься

«На близком расстоянии»: «Паразиты» по-русски

Weekend
Какие женские рубашки советуют носить главные модницы мира – 17 лучших вариантов Какие женские рубашки советуют носить главные модницы мира – 17 лучших вариантов

Рубашка – базовый предмет одежды

Cosmopolitan
Профессиональные «болезни» предпринимателей: что это и как с ними бороться Профессиональные «болезни» предпринимателей: что это и как с ними бороться

Чего ждать от типичных «болезней предпринимателя» и можно ли от них уберечься

Inc.
Прощай, мой господин: как разводились в Османской империи Прощай, мой господин: как разводились в Османской империи

Почему мужчины искали «промежуточных» мужей бывшим женам?

Cosmopolitan
Археологи нашли в Южном Туркменистане поселение цивилизации Окса Археологи нашли в Южном Туркменистане поселение цивилизации Окса

Археологи обследовали участок В Южном Туркменистане

N+1
У человечества нет плана «Б»: Петр Коваленко рассказывает, почему важна экомода У человечества нет плана «Б»: Петр Коваленко рассказывает, почему важна экомода

Экомода — новый тренд, о котором мы слышим всё чаще

Cosmopolitan
Невероятное будущее: футуролог о том, как изменится наша жизнь через 15 лет Невероятное будущее: футуролог о том, как изменится наша жизнь через 15 лет

Наши родители бы сказали, что это невозможно

Playboy
Как выглядит современная российская антиутопия? Рассказ Как выглядит современная российская антиутопия? Рассказ

Фрагмент рассказа «Смена» Эдуарда Веркина

Esquire
Best of the Best Best of the Best

Вспоминаем лучших из лучших — номинантов на премию GQ Men of the Year

GQ
Оптимистическая трагедия Оптимистическая трагедия

Софи Марсо — об отношении к эвтаназии и работе с Франсуа Озоном

Grazia
Ассирийцы построили осадную насыпь для взятия Лахиша из 19 тысяч тонн камня Ассирийцы построили осадную насыпь для взятия Лахиша из 19 тысяч тонн камня

На строительство 80-метрового сооружения у ассирийцев ушло меньше месяца

N+1
Открыть в приложении