Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Аммиак из пингвиньего гуано внес вклад в формирование облаков над Антарктидой Аммиак из пингвиньего гуано внес вклад в формирование облаков над Антарктидой

Из-за чего падает облачность в Антарктике?

N+1
Тили-тили тесто: выпечка по рецептам шеф-повара Александра Семыкина Тили-тили тесто: выпечка по рецептам шеф-повара Александра Семыкина

Выпечка по рецептам шефа ресторана «Пирог мясника» покорит любого

Cosmopolitan
Распространявшиеся за счет гомфотериев чилийские растения так и не оправились от их вымирания Распространявшиеся за счет гомфотериев чилийские растения так и не оправились от их вымирания

Гомфотерии регулярно поедали плоды и участвовали в распространении семян

N+1
Джокер и Харли Квин из СССР: как следовательница Воронцова полюбила преступника Джокер и Харли Квин из СССР: как следовательница Воронцова полюбила преступника

Зачем следовательница принесла пистолет преступнику?

Cosmopolitan
Как начать переписку с девушкой, чтобы она точно ответила Как начать переписку с девушкой, чтобы она точно ответила

Лучшие заменители опостылевшего всем «Привет! Как дела?»

Maxim
Обязательно ли завтракать? Вот что говорят исследования Обязательно ли завтракать? Вот что говорят исследования

Вокруг питания и завтрака, в частности, существует множество предубеждений

РБК
6 книг про искусственный интеллект — о том, что готовит нам будущее 6 книг про искусственный интеллект — о том, что готовит нам будущее

Книги, которые расскажут об умных роботах и tech-перспективах на ближайшие годы

Популярная механика
«Меня обходили стороной, словно смерть заразна»: как я пережила потерю дочери «Меня обходили стороной, словно смерть заразна»: как я пережила потерю дочери

У Юлии умерла дочь. Никто и ничто не помогало ей справиться с горем

Psychologies
Удар током: почему Москва не готова к высокому спросу на экологичные автомобили Удар током: почему Москва не готова к высокому спросу на экологичные автомобили

Почему в городах мира нет инфраструктуры для электромобилей?

Forbes
Не на птичьих правах Не на птичьих правах

Самые громкие правозащитные кейсы из мира животных

Weekend
Женщина года: бремя первых Женщина года: бремя первых

Что будет, если в одной комнате окажутся сразу две женщины года?

Glamour
Новый ASUS ZenBook Pro Duo: зачем ноутбуку два экрана Новый ASUS ZenBook Pro Duo: зачем ноутбуку два экрана

Сегодня от ноутбука требуется быть мастером на все клавиши

РБК
Нюхай апельсины, полюби лаванду: 5 привычек, которые изменят жизнь к лучшему Нюхай апельсины, полюби лаванду: 5 привычек, которые изменят жизнь к лучшему

Каждая из этих привычек поможет тебе изменить жизнь к лучшему в рекордные сроки

Cosmopolitan
12 французских фильмов про любовь и страсть 12 французских фильмов про любовь и страсть

Самые волнующие французские фильмы, которые заставят твое сердце биться чаще

Лиза
Микролазер в форме ленты Мёбиуса помог разобраться с геодезическими линиями Микролазер в форме ленты Мёбиуса помог разобраться с геодезическими линиями

Физики изготовили микролазер в форме ленты Мёбиуса

N+1
Темные пятна и светлые головы: 5 увлекательных книг по истории России Темные пятна и светлые головы: 5 увлекательных книг по истории России

Книги, которые помогут составить объективную картину прошлого России

Популярная механика
Спортсменки года: Дина и Арина Аверины Спортсменки года: Дина и Арина Аверины

Гимнастки заняли второе и четвертое места, но для зрителей они — номер один

Glamour
Как крупные компании поддерживают современное искусство Как крупные компании поддерживают современное искусство

Застройщик Hutton Development позволяет художникам украшать свои жилые комплексы

GQ
Новый Эрмитаж Новый Эрмитаж

«Возвращение блудного сына» Рембрандта и Колыванская ваза

Культура.РФ
Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем

Частые тренировки слишком сильно стрессуют организм?

Популярная механика
Карта Сан-Франциско на шести кассетах: чем пользовались водители для навигации до GPS Карта Сан-Франциско на шести кассетах: чем пользовались водители для навигации до GPS

Краткая история первых навигационных систем — в пересказе Ars Technica

VC.RU
Почему Стинг, Элтон Джон и Джеки Чан лишили детей наследства? Почему Стинг, Элтон Джон и Джеки Чан лишили детей наследства?

Эти знаменитости считают, что деньги испортят их наследников

Cosmopolitan
Британский фотограф снимает советские радиоактивные (ну почти) руины Британский фотограф снимает советские радиоактивные (ну почти) руины

Потрясающая галерея бывших советских ядерных полигонов произвела фурор в Лондоне

Maxim
Физики проследили за распространением мощного лазерного луча в воде Физики проследили за распространением мощного лазерного луча в воде

Физики исследовали распространение мощного лазерного излучения через воду

N+1
Краткая история феминизма в СССР и России: от XIX века до наших дней Краткая история феминизма в СССР и России: от XIX века до наших дней

С чего в России начался феминизм и как он развивался до сегодняшнего дня?

Esquire
Разорванную звезду перестали считать источником высокоэнергетичных нейтрино Разорванную звезду перестали считать источником высокоэнергетичных нейтрино

Звезда, разрываемой черной дырой, больше не считается источником нейтрино

N+1
Физики нашли осцилляции в электромагнитном форм-факторе нейтрона Физики нашли осцилляции в электромагнитном форм-факторе нейтрона

Обнаружены осцилляции, которые свидетельствуют о сложной структуре нуклонов

N+1
«Мать выгнала меня из дома. А теперь ждет, что я стану ухаживать за ней» «Мать выгнала меня из дома. А теперь ждет, что я стану ухаживать за ней»

Обязаны ли взрослые дети помогать родителям?

Psychologies
Вот скажи мне, американец: каково это — быть российским предпринимателем в США Вот скажи мне, американец: каково это — быть российским предпринимателем в США

Российские предприниматели — о негативном и предвзятом отношении к себе в США

Esquire
Средневековый вопрос: каким получился фильм «Последняя дуэль» Средневековый вопрос: каким получился фильм «Последняя дуэль»

«Последняя дуэль» — историческая драма Ридли Скотта

РБК
Открыть в приложении