Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Международная комиссия предложила пересмотреть определение ожирения Международная комиссия предложила пересмотреть определение ожирения

Ученые предложили разделить ожирение на две различные формы

N+1
О чем думают девушки, когда занимаются сексом на одну ночь? О чем думают девушки, когда занимаются сексом на одну ночь?

Какие подводные камни кроются за согласием «просто разок поехать к тебе»

Maxim
Генетики прочитали ДНК последних охотников-собирателей Гималаев Генетики прочитали ДНК последних охотников-собирателей Гималаев

Генетики проанализировали ДНК больше ста представителей группы рауте

N+1
Мы созданы для жизни вдвоем? Мы созданы для жизни вдвоем?

Люди предназначены для жизни вдвоем или в одиночестве?

Psychologies
Соскочить с крючка вины: как распознать манипуляцию с первой секунды Соскочить с крючка вины: как распознать манипуляцию с первой секунды

Что такое навязанная вина и как она связана с манипуляцией?

VOICE
Уйти и не сдаваться Уйти и не сдаваться

От чего и куда бежит Уэс Андерсон

Weekend
Какая вода лучше всего подходит для ДНК: новое исследование Какая вода лучше всего подходит для ДНК: новое исследование

Ученые сравнили распределение натрия и калия в разных растворах вокруг ДНК

Популярная механика
10 вложений, которые в итоге окупятся 10 вложений, которые в итоге окупятся

Истории, как купить что-то дорогое, но качественное, и не пожалеть

Maxim
Куда пропали 10 ярких звезд КВН, веселивших страну в нулевых Куда пропали 10 ярких звезд КВН, веселивших страну в нулевых

Но где сегодня Ляля из «Утомленных солнцем» или Жанка из «Пармы»?

Cosmopolitan
Анна Пескова. По другую сторону экрана Анна Пескова. По другую сторону экрана

Анна Пескова — о другой стороне экрана

Коллекция. Караван историй
Волнистые астрильды с ярко-красной грудью обошли сородичей по социальному статусу Волнистые астрильды с ярко-красной грудью обошли сородичей по социальному статусу

Волнистые астрильды занимают в иерархии место, соответствующее их расцветке

N+1
Лучшие фильмы про Элвиса Пресли Лучшие фильмы про Элвиса Пресли

Самые значительные главы из романа короля рок-н-ролла с кинематографом

GQ
Николай Цискаридзе: те, кого он любил Николай Цискаридзе: те, кого он любил

Николай Цискаридзе — талант, влюбленность в искусство и бойцовский характер

СНОБ
Роман о мечтах и обо всем, что встречается на пути. Фрагмент книги Аудур Авы Олафсдоттир Роман о мечтах и обо всем, что встречается на пути. Фрагмент книги Аудур Авы Олафсдоттир

Отрывок из романа «Мисс Исландия» — о борьбе за счастье и эмпансипации

Esquire
Спектроскопия помогла недеструктивно измерить красноту мякоти яблок Спектроскопия помогла недеструктивно измерить красноту мякоти яблок

Спектроскопия поможет повысить эффективность их сортировки

N+1
«Что в чемоданах — неизвестно»: как работает Unclaimed Baggage из США, который продаёт потерянный в аэропорту багаж «Что в чемоданах — неизвестно»: как работает Unclaimed Baggage из США, который продаёт потерянный в аэропорту багаж

Unclaimed Baggage — магазин, перепродающий вещи из невостребованного багажа

VC.RU
Культ личности: почему сейчас в России так много разводов Культ личности: почему сейчас в России так много разводов

Почему люди так часто предпочитают «одиночное плавание»

Cosmopolitan
Горячие закуски на скорую руку: простые мужские рецепты Горячие закуски на скорую руку: простые мужские рецепты

Простые мужские блюда, которые ты легко сможешь повторить

Maxim
Разнообразие как ключ к счастливой и осмысленной жизни Разнообразие как ключ к счастливой и осмысленной жизни

Говорят, разнообразие придает жизни вкус. Но что конкретно мы можем сделать?

Psychologies
Вива, Виктория! Вива, Виктория!

Виктория Мирошниченко — о мастерстве перевоплощения и сибирских травах

Grazia
Археологи нашли на Дону серебряную накладку с изображениями скифских богов Археологи нашли на Дону серебряную накладку с изображениями скифских богов

Ученые обнаружили изображения богов в скифском погребении IV века до нашей эры

N+1
От Тома Круза до Мадонны: самые шокирующие бьюти-трансформации звезд От Тома Круза до Мадонны: самые шокирующие бьюти-трансформации звезд

Знаменитости, для которых вмешательство во внешность имели серьезные последствия

Cosmopolitan
Американский флот слабеет. Китай получает исторический шанс Американский флот слабеет. Китай получает исторический шанс

Сравнительный анализ военно-морских сил США и Китая

Эксперт
«Отсутствие силы воли помогло мне чего-то добиться в жизни». Интервью с ресторатором и телеведущим Дмитрием Левицким «Отсутствие силы воли помогло мне чего-то добиться в жизни». Интервью с ресторатором и телеведущим Дмитрием Левицким

Предприниматель и телеведущий рассказал о пользе лени

СНОБ
Умники и умницы: 9 сериалов для настоящих интеллектуалов Умники и умницы: 9 сериалов для настоящих интеллектуалов

Презираешь сериалы, считая их пустой тратой времени и глупым развлечением?

Cosmopolitan
Кажется, мы зря забросили биохакинг Кажется, мы зря забросили биохакинг

Биохакинг вещь и правда полезная

GQ
Почему Ozon продолжает тратить деньги на борьбу за клиентов вместо получения прибыли Почему Ozon продолжает тратить деньги на борьбу за клиентов вместо получения прибыли

Траты Ozon на IT и маркетинг отдаляют момент получения операционной прибыли

Forbes
Беспроигрышная лотерея Беспроигрышная лотерея

Зачем аналитики и экономисты делают неверные прогнозы и не останавливаются

Forbes
Деми Мур, какой мы ее уже не помним: 20 редких фотографий Деми Мур, какой мы ее уже не помним: 20 редких фотографий

Редкие фотографии Деми Мур

Cosmopolitan
Могут ли выпадать волосы от шампуней с сульфатами в составе: разрушаем мифы о моющих средствах Могут ли выпадать волосы от шампуней с сульфатами в составе: разрушаем мифы о моющих средствах

Разбираемся, действительно ли сульфаты в шампуне вредят волосам

ТехИнсайдер
Открыть в приложении