Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Робопчелу научили садиться по-комарьи Робопчелу научили садиться по-комарьи

Инженеры разработали шасси для миниатюрного орнитоптера RoboBee

N+1
Как крупные компании поддерживают современное искусство Как крупные компании поддерживают современное искусство

Застройщик Hutton Development позволяет художникам украшать свои жилые комплексы

GQ
Капуцины острова Хикарон обзавелись традицией похищать и носить на себе детенышей ревунов Капуцины острова Хикарон обзавелись традицией похищать и носить на себе детенышей ревунов

У капуцинов появилась традиция похищать и носить детенышей ревунов

N+1
Сонник: 10 самых популярных снов и их толкование Сонник: 10 самых популярных снов и их толкование

Популярные сны, которые несут скрытый смысл

Cosmopolitan
Когда медицина перестает быть бумажной: как Москва лечит людей и спасает деревья Когда медицина перестает быть бумажной: как Москва лечит людей и спасает деревья

Как электронная медицина спасает сотни деревьев?

Правила жизни
Как выращивают крупнейшие в мире алмазы: сделано в России Как выращивают крупнейшие в мире алмазы: сделано в России

Самые крупные в мире безупречные алмазы выращивают рядом с Санкт-Петербургом

Популярная механика
Владимир Иванов: «Все ученики становятся для меня родными» Владимир Иванов: «Все ученики становятся для меня родными»

Педагог заявила: «Не надо вам в артисты!» И вот тут взыграла моя гордыня

Караван историй
20 способов изменить жизнь прямо сейчас 20 способов изменить жизнь прямо сейчас

Вот что можно сделать уже сегодня

Psychologies
«Мужчины меня боятся, а женщины ненавидят». Девушку хейтят за привлекательность «Мужчины меня боятся, а женщины ненавидят». Девушку хейтят за привлекательность

Вероника Райек столкнулась с травлей в сети из-за своей … красоты

Cosmopolitan
Ученые против старения: книги о том, как прожить больше 100 лет Ученые против старения: книги о том, как прожить больше 100 лет

Книги о средства по борьбе со старением

Популярная механика
Толстеть или худеть: как вес влияет на женское здоровье – объясняет гинеколог Толстеть или худеть: как вес влияет на женское здоровье – объясняет гинеколог

Так ли важно женщине следить за килограммами?

Cosmopolitan
Николай Хомерики Николай Хомерики

Самый лиричный режиссер нулевых – Николай Хомерики

Собака.ru
Кто и когда изобрёл ластик Кто и когда изобрёл ластик

Как только человек овладел письмом, ему понадобился инструмент для стирания

Популярная механика
От Иван-чая до ройбуша: самые полезные чаи для мужчин От Иван-чая до ройбуша: самые полезные чаи для мужчин

Виды чая, которые стоит включить в свою жизнь, чтобы быть здоровым

Playboy
Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон

Комиксы BlooMe точно поднимут тебе настроение в холодный сезон!

Cosmopolitan
6 рецептов осенних салатов, которые вам стоит приготовить дома 6 рецептов осенних салатов, которые вам стоит приготовить дома

Шеф-повара поделились своими секретными рецептами салатов

GQ
Темные пятна и светлые головы: 5 увлекательных книг по истории России Темные пятна и светлые головы: 5 увлекательных книг по истории России

Книги, которые помогут составить объективную картину прошлого России

Популярная механика
Кто первым узнал, что вы сделали прошлым летом Кто первым узнал, что вы сделали прошлым летом

Судьба создательницы первых подростковых триллеров и ее главного романа

Weekend
Созвездие близнецов: зачем врагам Цукерберга братьям Уинклвосс своя метавселенная Созвездие близнецов: зачем врагам Цукерберга братьям Уинклвосс своя метавселенная

Соперничество между Марком Цукербергом и братьями Уинклвоссами не утихает

Forbes
Почему Стинг, Элтон Джон и Джеки Чан лишили детей наследства? Почему Стинг, Элтон Джон и Джеки Чан лишили детей наследства?

Эти знаменитости считают, что деньги испортят их наследников

Cosmopolitan
Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски Белковое окрашивание волос: как получить стойкий и мягкий эффект от краски

Способ сделать процедуру окрашивания щадящей и закрепить оттенок волос

Cosmopolitan
Серая зона отказа: понимаем ли мы слово «нет» Серая зона отказа: понимаем ли мы слово «нет»

Исследование продемонстрировало неоднозначное отношение мужчин к отказу

СНОБ
Археологи нашли в Синьцзяне древнейшие кожаные доспехи Евразии Археологи нашли в Синьцзяне древнейшие кожаные доспехи Евразии

Древнейшие доспехи Евразии изготовили не позднее VI века до нашей эры

N+1
Лучшие фильмы про Элвиса Пресли Лучшие фильмы про Элвиса Пресли

Самые значительные главы из романа короля рок-н-ролла с кинематографом

GQ
Лилия Бурдинская Лилия Бурдинская

Танц-художница и основательница центра Bye Bye Ballet Лилия Бурдинская

Собака.ru
Цветной бархат, уютные шарфы и очень много вельветовых костюмов: из чего состоит гардероб Уэса Андерсона Цветной бархат, уютные шарфы и очень много вельветовых костюмов: из чего состоит гардероб Уэса Андерсона

Главные элементы персонального стиля режиссера Уэса Андерсона

Esquire
Физики напрямую увидели сигма-дырку на поверхности атома брома Физики напрямую увидели сигма-дырку на поверхности атома брома

Первое в мире прямое подтверждение анизотропии заряда в галогенах

N+1
Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой

Инга Артамонова была одной из самых красивых советских спортсменок СССР

Cosmopolitan
Не узнает лицо и не зарядится: чем грозят попытки самостоятельно починить смартфон Не узнает лицо и не зарядится: чем грозят попытки самостоятельно починить смартфон

Стремление сэкономить на ремонте телефона привести к еще большим расходам

Playboy
Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе

Зачем сейчас инвестировать в моду и когда люкс бренды появятся на маркетплейсах

Forbes
Открыть в приложении