«Мне говорили, что это никогда не будет работать»: как российский инженер Google научил телефон понимать жесты
Российский инженер Иван Пупырев в 2014 году начал работать над технологией Soli, которая спустя пять лет позволила Google выпустить первый в мире смартфон, понимающий взмахи рук пользователя — Pixel 4. Forbes поговорил с изобретателем о проблемах, с которыми столкнулись создатели смартфона, о новых проектах российского изобретателя и сложностях в работе с талантливыми людьми.
15 октября 2019 года компания Google презентовала свои новые продукты, в том числе показала следующую версию своего смартфона — Pixel 4. Новинка умеет распознавать пользователя по лицу под любым углом. Кроме того, устройство получило новую технологию — Motion Sense, которая позволяет ему понимать жесты пользователя. Рядом с камерой Pixel 4 расположился мини-радар, который понимает движения рук человека без прикосновения к экрану. Над его созданием в рамках проекта Soli, основанном на технологии радарного датчика, последние пять лет работал Иван Пупырев, руководитель проектов лаборатории Google Advanced Technology and Projects (ATAP), которая занимается нестандартными разработками.
До того, как прийти в Google, Пупырев, выпускник Московского авиационного института (МАИ), успел поработать с Disney и Sony. В Disney он создал 17 интерактивных технологий, часть из которых компания задействовала в своих парках аттракционов. Самая главная из них — Touché, которая позволяла распознавать прикосновения человека к предмету, растению или даже воде.
Работая в Sony, Пупырев еще до появления первого iPhone в 2007 году, предлагал выпустить мобильный телефон с сенсорным дисплеем, но в компании не поддержали эту идею, хотя Пупырев уверен, что японская корпорация могла опередить появление iPhone. Пупырев и его коллеги из Sony придумали другой проект — Gummi. Это небольшой дисплей, на котором для перемещения объектов можно водить пальцем по оборотной стороне устройства. Sony применила технологию задней сенсорной панели на игровой консоли PlayStation Vita, которую выпустила в 2011 году.
Forbes побеседовал с инженером о невербальном взаимодействии человека с техникой, привычке людей к кнопкам, «умных куртках» и «сумасшедших идеях», которые работают.
Чем отличаются технология Soli и датчик Motion Sense в смартфоне Pixel 4?
Motion Sense – это не другая технология, это та же самая Soli. С точки зрения брендинга Pixel 4 в Google решили назвать ее Motion Sense. В телефоне у нее более узкое применение: она должна распознавать взаимодействия пользователя с телефоном. Для того, чтобы пользователю было понятнее, что это за технология, ее назвали Motion Sense.
Какой функционал Soli задействован в смартфоне?
Само по себе технология может делать много вещей. Так как она новая и была создана с нуля, мы решили ограничить ее использование. Кроме того, мы столкнулись с большим количеством технических трудностей при ее внедрении.
Сейчас технология используется для распознавания человеческих действий. Философия применения Soli в интерфейсах состоит в том, что смартфон должен понимать, что вокруг него происходит и это не должно требовать от пользователя каких-то специальных действий. Это то, что мы называем невербальное взаимодействие — без использования голоса или кнопок. Мы заинтересованы в том, чтобы телефон был умный как человек, и понимал, что происходит вокруг, понимал контекст.
Сейчас, например, в нем есть функция, которая позволяет жестом убавить звук звонящего телефона. Можно жестом отключить звонок или будильник. Это очень удобно, потому что когда в семь утра звонит будильник и ты пытаешься проснуться, тебе не надо брать телефон и нажимать какую-то кнопку – ты просто протягиваешь руку и звук отключается сам.
В Pixel 4 есть также технология идентификации пользователя по лицу. Тут всегда возникает вопрос, когда должны включаться камеры распознавания. Если они работают все время, то у вашего телефона быстро сядет батарейка. Поэтому телефон должен распознавать «знаки», которые сигнализируют о том, что пользователь намеревается использовать эту функцию. Soli позволяет нашему телефону понимать намерения. Если Pixel 4 лежит на столе, а рука пользователя протягивается к нему, в этот момент камеры уже активируются и начинают работать еще до того, как владелец поднес телефон к лицу. Эта комбинация сенсоров ускоряет процесс, и сохраняет заряд батарейки.
Последняя функция состоит в том, что когда телефон лежит на столе, а вас рядом нет, то его дисплей выключается. А когда вы подходите к телефону, он снова включается.
Сенсор может делать гораздо больше, но все эти вещи — новые для пользователя. Поэтому мы бы хотели, чтобы пользователи привыкли к тому, что есть сейчас, а потом подумаем о расширении возможностей.
С какими сложностями вы столкнулись при внедрении Soli в Pixel 4?
Внедрение любой технологии, разработанной в лаборатории, в продукт — это долгий и тяжелый процесс. Когда вы работаете над исследованием, вам надо показать, что технология работает хотя бы один раз. Когда вы работаете над продуктом, нужно показать, что технология работает всегда. Вам нужно принять во внимание огромное количество ситуаций, при которых она не будет работать. Что происходит с Soli, когда человек роняет телефон, что происходит, когда другие сенсоры включены, есть ли какое-то ненужное взаимодействие между другими сенсорами и Soli? Ни у одной компании в мире нет опыта внедрения радара в мобильный телефон. Поэтому нет никакой документации на этот счет.
Поскольку индустрия мобильных телефонов уже довольно развитая, большое количество знаний о том, как делать телефон, находится на фабриках. У фабрик, которые делают телефоны, есть много наработанных производственных технологий. Но когда они получают новую технологию, они тоже не знают, что с ней делать. Им нужно выстраивать новую продуктовую линию, тренировать операторов на фабрике, определять возникающие проблемы, потому что они еще никогда не внедряли эту технологию. Нужно учитывать огромное количество деталей, потому что, когда ты выпускаешь миллион телефонов, маленькая деталь может повлиять на тысячи людей.