Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Шимпанзе заразились зевотой от головы андроида Шимпанзе заразились зевотой от головы андроида

Шимпанзе способны заразиться зевотой от зевающей головы человекоподобного робота

N+1
«Опыт предыдущих поколений новым уже не нужен»: Екатерина Шульман о воспитании детей «Опыт предыдущих поколений новым уже не нужен»: Екатерина Шульман о воспитании детей

Как воспитывать детей в постоянно изменяющемся мире?

Forbes
Древние люди 700 000 лет глотали зерна, пока не научились их разжевывать Древние люди 700 000 лет глотали зерна, пока не научились их разжевывать

Первые доказательства: диета может возникать раньше физической адаптации

ТехИнсайдер
5 главных вопросов о DDR5: стоит ли переходить на эту память уже сейчас? 5 главных вопросов о DDR5: стоит ли переходить на эту память уже сейчас?

Отвечаем на основные вопросы о новом стандарте оперативной памяти DDR5

CHIP
Леонардо да Винчи. Биография Леонардо да Винчи. Биография

Почему «Джоконда» – шедевр, на который хотят посмотреть вживую миллионы людей

kiozk originals
Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой Гибель в 29 лет: ужасная судьба лучшей конькобежки СССР Инги Артамоновой

Инга Артамонова была одной из самых красивых советских спортсменок СССР

Cosmopolitan
Собственными руками: как Карл-Фридрих Шойфеле изменил судьбу мануфактуру Chopard Собственными руками: как Карл-Фридрих Шойфеле изменил судьбу мануфактуру Chopard

Как Карл-Фридрих Шойфеле решился самостоятельно создавать часовые калибры

Forbes
Горящая земля и деревня под водой: 7 мест на планете, куда бы вы не захотели отправиться Горящая земля и деревня под водой: 7 мест на планете, куда бы вы не захотели отправиться

Пожар под землей и опасные отходы: в этих городах вы точно не пожелаете побывать

Playboy
Роман в дневниках. Анна Матвеева: «Каждые сто лет» Роман в дневниках. Анна Матвеева: «Каждые сто лет»

Истории двух женщин, которых разделяют сто лет

СНОБ
Зоологи подтвердили существование городской популяции леопардов в Сеуле в конце XIX века Зоологи подтвердили существование городской популяции леопардов в Сеуле в конце XIX века

Крупные кошки в Сеуле охотились на собак, а днем прятались среди растительности

N+1
Надпись support.apple.com/iphone/restore на экране iPhone: что случилось и что делать? Надпись support.apple.com/iphone/restore на экране iPhone: что случилось и что делать?

Support.apple.com/iphone/restore — читайте, что она означает и как все починить

CHIP
«Мать выгнала меня из дома. А теперь ждет, что я стану ухаживать за ней» «Мать выгнала меня из дома. А теперь ждет, что я стану ухаживать за ней»

Обязаны ли взрослые дети помогать родителям?

Psychologies
Дрон с электронным хоботом унюхал запахи в труднодоступных местах Дрон с электронным хоботом унюхал запахи в труднодоступных местах

Электронный нос с десятиметровой трубкой позволит анализировать запах

N+1
Как понять, что аромат тебе не подходит: 5 правил, которые помогут выбрать духи Как понять, что аромат тебе не подходит: 5 правил, которые помогут выбрать духи

Осознать, что парфюм тебе не очень подходит, действительно сложно

Cosmopolitan
Том Хоппер: «Из спортзала я выхожу счастливым» Том Хоппер: «Из спортзала я выхожу счастливым»

Том Хоппер рассказал нам, как его успокаивает штанга, и поделился рецептом пиццы

Cosmopolitan
Дыши глубже! Дыши глубже!

10 комнатных растений, которые очищают и обеззараживают воздух в квартире

Лиза
Вес слова Вес слова

Если карьера не задалась, у вас есть реальный шанс стать преуспевающим спикером

Forbes
«Мы как Nascar — избавляемся от всего, что тормозит»: в США фирмы всё реже просят диплом и нанимают без собеседований «Мы как Nascar — избавляемся от всего, что тормозит»: в США фирмы всё реже просят диплом и нанимают без собеседований

Компаниям в США приходится снижать требования к новым сотрудникам

VC.RU
Искусство жить красиво Искусство жить красиво

История у гостиницы «Метрополь» всегда была непростой

Караван историй
На чем ездила элита СССР. Экзотические модели и их владельцы На чем ездила элита СССР. Экзотические модели и их владельцы

Каких «инопланетян» могли повстречать на дорогах граждане Союза

РБК
Как выглядит самое ядовитое в мире дерево, под которым даже запрещено стоять в дождь Как выглядит самое ядовитое в мире дерево, под которым даже запрещено стоять в дождь

Безопаснее всего смотреть на это дерево на картинках

Популярная механика
Выкинуть из головы: почему мы так боимся собственного мусора Выкинуть из головы: почему мы так боимся собственного мусора

Антрополог объясняет, почему современный человек так боится собственного мусора?

Esquire
Компьютер не видит жесткий диск: что делать? Компьютер не видит жесткий диск: что делать?

Почему компьютер не видит жесткий диск и как решить эту проблему?

CHIP
10 программ для рисования на графическом планшете 10 программ для рисования на графическом планшете

Paint, Gimp и другие программы для диджитал-художников

CHIP
Пингвин Адели преодолел 3000 километров и добрался из Антарктиды в Новую Зеландию Пингвин Адели преодолел 3000 километров и добрался из Антарктиды в Новую Зеландию

Пингвин Адели заблудился и отплыл на 3000 километров от дома

N+1
Своя игра Своя игра

Актриса и певица Нино Нинидзе примерила сияющие вечерние образы

Harper's Bazaar
Художник, случайно сорвавший маску с человечества: жизнь и творчество классика современного искусства Олега Целкова Художник, случайно сорвавший маску с человечества: жизнь и творчество классика современного искусства Олега Целкова

Олег Целков — один из лидеров советского нонконформизма

Esquire
Коммунисты на привале. Стоит ли верить охотничьим байкам Валерия Рашкина Коммунисты на привале. Стоит ли верить охотничьим байкам Валерия Рашкина

У депутата Госдумы от КПРФ Валерия Рашкина не выдержала совесть

СНОБ
Евгения Кузнецова. Под «колпаком» Галины Волчек Евгения Кузнецова. Под «колпаком» Галины Волчек

Думалось, она будет всегда, но два года назад Галина Волчек покинула театр

Караван историй
«Это похоже на наркотик — включаешь плеер и забываешь про весь остальной мир»: история кассетного проигрывателя Walkman «Это похоже на наркотик — включаешь плеер и забываешь про весь остальной мир»: история кассетного проигрывателя Walkman

Walkman считался «символом статуса», а его название стало нарицательным

VC.RU
Открыть в приложении