Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Японцы сделали робоверсию ожившего трехногого стула из аниме Японцы сделали робоверсию ожившего трехногого стула из аниме

Инженеры воспроизвели оживший стул без одной ноги и научили его ходить

N+1
Елена Ленская: Елена Ленская:

Елена Ленская — о своей карьере, браках и настоящей любви

Коллекция. Караван историй
Собак из скандинавского погребения в лодке приписали к элитной породе Собак из скандинавского погребения в лодке приписали к элитной породе

Ученые исследовали останки пяти собак, которых нашли на шведском острове Эланд

N+1
10 иллюзий, с которыми нужно расстаться во взрослой жизни 10 иллюзий, с которыми нужно расстаться во взрослой жизни

Иллюзии, что поддерживали нас в детстве, в старшем возрасте только мешают

Psychologies
Что происходит с организмом, если долго хранить девственность Что происходит с организмом, если долго хранить девственность

Вредно ли для организма долго жить с девственностью или нет?

Psychologies
Как женщины-режиссеры борются за место в индустрии в России и мире Как женщины-режиссеры борются за место в индустрии в России и мире

Отрывок из книги Анжелики Артюх «Кинорежиссерки в современном мире»

Forbes
Иллюзии и мода: Петр Коваленко — о 5 главных ошибках при покупке одежды Иллюзии и мода: Петр Коваленко — о 5 главных ошибках при покупке одежды

Какие именно заблуждения мешают нам правильно выбирать одежду

Cosmopolitan
Они тебя обманывают: 8 «диетических» продуктов, от которых толстеют Они тебя обманывают: 8 «диетических» продуктов, от которых толстеют

Некоторые продукты только кажутся полезными и диетическими

Cosmopolitan
Такие неопасные, но ужасные колики Такие неопасные, но ужасные колики

Младенческие колики отравляют жизнь всей семье, как с ними справиться?

Здоровье
Певица года: Манижа Певица года: Манижа

Манижа показала российскому обществу его лицо

Glamour
Углекислый газ выступил катализатором получения амидов Углекислый газ выступил катализатором получения амидов

Ученые предложили экологичный и дешевый метод переамидирования

N+1
Гид по татуировкам Гид по татуировкам

Тренды в тату-индустрии

Playboy
Плазмида с CRISPR/Cas9 убила патогенные штаммы в кишечнике мыши Плазмида с CRISPR/Cas9 убила патогенные штаммы в кишечнике мыши

Ученым создали плазмиду с высокой скоростью конъюгации

N+1
Утилизация автомобиля: инструкция, условия, список документов Утилизация автомобиля: инструкция, условия, список документов

Утилизация машины поможет сэкономить деньги и позаботиться об окружающей среде

РБК
Извержения вулканов подтолкнули предков пуэбло к оседлости Извержения вулканов подтолкнули предков пуэбло к оседлости

Археологи изучили последствия похолодания VI века

N+1
В переговорах о покупке доли в Natura Siberica появился новый участник В переговорах о покупке доли в Natura Siberica появился новый участник

В переговорах о разделе долей в компании Natura Siberica участвует Павел Грачев

Forbes
Большой город Большой город

Почему большие города не теряют своего значения и продолжают увеличиваться

Esquire
Как собрать вокруг себя карьерных единомышленников Как собрать вокруг себя карьерных единомышленников

Как собрать вокруг себя крепкую и эффективную команду?

GQ
Бюджет: каждому свое? Бюджет: каждому свое?

Следует ли нам обсуждать с партнером свои финансы?

Psychologies
Прокофьевы. Дела семейные Прокофьевы. Дела семейные

Прокофьевы: заочный музыкальный диалог великого деда и талантливого внука

СНОБ
Игра отражений: случай Жапризо Игра отражений: случай Жапризо

Галина Ельшевская рассказывает о «Ловушке для Золушки» Себастьяна Жапризо

Полка
Особый взгляд Особый взгляд

Подборка психологических книг, помогающих разобраться в себе и окружающих

Psychologies
«Поколение «сэндвич»: почему людям в возрасте 45-65 лет не хватает времени на себя «Поколение «сэндвич»: почему людям в возрасте 45-65 лет не хватает времени на себя

Отрывок из книги «Поколение «сэндвич»: почему не стоит хвалить за таланты

Forbes
«Мой якорь — материнская любовь и вера»: хореограф Акрам Хан о своем балете Kaash «Мой якорь — материнская любовь и вера»: хореограф Акрам Хан о своем балете Kaash

Акрам Хан — о том, что такое современный балет и что он дает зрителю

Forbes
Держим спину Держим спину

Что влияет на осанку и как о ней правильно заботиться

Лиза
5 ошибок, за которые стоит себя простить 5 ошибок, за которые стоит себя простить

Важно признать свои ошибки и простить себя за них

Psychologies
«Канувшие в Лету»: графические форматы, о которых мало кто помнит «Канувшие в Лету»: графические форматы, о которых мало кто помнит

Первые графические стандарты

VC.RU
Спортсменки года: Дина и Арина Аверины Спортсменки года: Дина и Арина Аверины

Гимнастки заняли второе и четвертое места, но для зрителей они — номер один

Glamour
5 мест, куда можно с пользой сдать старые вещи 5 мест, куда можно с пользой сдать старые вещи

Куда сдать свою старую одежду с пользой для себя и других людей

GQ
No stress No stress

Профессиональная жизнь Анастасии Уколовой набирает обороты

OK!
Открыть в приложении