Лауреат премии «Оскар» создает цифровых андроидов для общения с людьми

РБКHi-Tech

Тема номера — Андроиды

Аватары

Лауреат премии «Оскар» создает цифровых андроидов для общения с людьми

Основанный новозеландцем Марком Сагаром стартап Soul Machines создает виртуальных работников для компаний — цифровые андроиды с анатомической точностью повторяют строение лица человека. В Soul Machines уверены: через десять лет у всех людей появятся свои электронные копии, которые будут представлять их в реальной жизни

Текст Елизавета Архангельская

«Моя страсть — это создание сгенерированных на компьютере лиц, по сути — набора единиц и нулей, которые дают ощущение, будто они сознательные, живые существа со своими эмоциями» — примерно так описывал свою работу новозеландец Марк Сагар, выступая на церемонии вручения специальной премии «Оскар» за научные и технические достижения в 2011 году

Тогда Сагар получил награду за технологии точного переноса мимики человека на лица анимированных героев (facial motion retargeting). Для инженера это был уже второй «Оскар»: годом ранее вместе с коллегами он получил приз за технологию захвата движения Light Stage. Изобретения Сагара, который в то время работал в компании-разработчике спецэффектов для кино Weta Digital, использовались в таких фильмах, как «Аватар» и «Кинг-Конг».

«Наука и искусство связаны гораздо сильнее, чем кажется», — говорил Сагар все в той же речи. Получив второй «Оскар», он уволился из Weta и вернулся в родной Оклендский университет, который окончил за 20 лет до этого. В январе 2012 года инженер создал там лабораторию анимационных технологий и вместе с другими учеными и студентами стал разрабатывать так называемых цифровых андроидов — нарисованных на компьютере моделей человека с искусственным интеллектом, которые могут общаться с людьми, считывая их реакции через веб-камеру и микрофон. А через четыре года для коммерциализации разработок Сагар основал стартап Soul Machines, который в ноябре 2016-го привлек $7,5 млн от инвесторов мирового уровня.

Цифровой первенец 

Лицо ребенка двух-трех лет на черном фоне компьютерного монитора в лаборатории Марка Сагара кажется живым — ощущение, что на ученого смотрит реальный человек. Девочка улыбается, хмурится, взглядом следит за движениями собеседника по эту сторону экрана. Аватар BabyX — первый прототип цифрового человека, созданный Сагаром и его командой, рассказал в интервью журналу РБК директор по развитию бизнеса Soul Machines Грег Кросс. 

На разработку и совершенствование BabyX ушло четыре года. Как и  следующие андроиды Soul Machines, он основан на точной модели человеческого лица, построенной программистами и нейрофизиологами. Модель состоит из «слоев»: повторяет строение черепа, расположение мышц на лице и механизмы их сокращения. Лицо робот «позаимствовал» у реального ребенка, которого фотографировали в разное время и с разными эмоциями.

Ключевой разработкой Soul Machines Кросс называет эмоциональный интеллект, который с помощью технологий машинного обучения учится выражать настроение мимикой и голосом, а через веб-камеру и микрофон распознавать интонации и движения лица человека и копировать их. «Они эмоционально отзывчивы: могут не только понимать, но и выражать чувства, подобно человеку», — говорит Кросс.

Виртуальный ребенок также умеет отвечать на вопросы и играть. BabyX узнает картинки с животными и предметами, которые ему показывают люди: может, например, опознать яблоко или щенка. Теперь Soul Machines разрабатывает новую версию андроида — ребенок будет представлен в полный рост, программисты даже продумали наличие у него «легких», ведь «дыхание — важный компонент симуляции речи», объяснял Сагар в интервью для сайта IBM. Новый цифровой ребенок сможет рисовать на экране компьютера и играть с виртуальными объектами.

Первый цифровой аватар, ребенка, Soul Machines разработала для демонстрации возможностей эмоционального интеллекта своих роботов. Теперь стартап создает виртуальных сотрудников для крупных компаний

Создатели BabyX демонстрировали его инвесторам, которые приезжали в Оклендский университет. Проектом заинтересовался фонд Horizons Ventures, основанный Ли Кашином, самым богатым, по оценке Forbes, миллиардером Гонконга. В ноябре 2016-го недавно зарегистрированный стартап Soul Machines привлек первые инвестиции в $7,5 млн — самая крупная сумма для выросших в стенах Оклендского университета проектов.

Horizons Ventures выступил лид-инвестором, в сделке также участвовала инвесткомпания ICONIQ Capital — по данным американского журнала Forbes, она управляет деньгами основателя Facebook (соцсеть признана в РФ экстремистской и запрещена) Марка Цукерберга. Инвесторы получили в Soul Machines долю 35%, писало издание NBR, примерно 37% осталось у Сагара. Еще около 17% досталось компании UniServices, которая помогает ученым университета коммерциализировать разработки и находить инвесторов. Кто владеет оставшейся долей, Кросс раскрыть отказался. Интеллектуальные права на созданные командой Сагара в стенах университета технологии получила Soul Machines.

Работник без зарплаты

После первого раунда инвестиций выстраивать бизнес-процессы стартапа позвали опытного управленца Грега Кросса, который к тому времени успел поработать главой нескольких технологических компаний, например производителя систем энергопитания PowerbyProxi, бизнес-инкубатора Icehouse и разработчика решений для e-commerce SLI Systems. С инвестициями и новым топ-менеджером разработчики Soul Machines ускорились: за неполный год создали шесть новых цифровых персонажей, рассказывает Кросс.

В отличие от BabyX новые разработки — коммерческие. В феврале 2017-го Soul Machines выпустила первую виртуальную помощницу по имени Надя (Nadia). Она создана по заказу австралийского правительства для помощи людям с ограниченными возможностями. Надя стала первой цифровой сотрудницей австралийского правительства, говорит Кросс: она умеет устно и письменно в онлайн-режиме отвечать на вопросы о системе страхования для инвалидов, полезных сервисах и средствах поддержки. Цифровая помощница разговаривает голосом актрисы Кейт Бланшетт, которая согласилась озвучить Надю.

На создание ушел год, еще около года она будет работать в пилотном режиме. В «голове» Нади — система искусственного интеллекта IBM Watson для распознавания речи и ответов на вопросы. Новозеландская компания FaceMe отвечала за техническую часть — передачу изображения в онлайн-режиме и совместимость системы с любыми пользовательскими устройствами.

У основателя Soul Machines Марка Сагара две премии «Оскар» за технологии «оживления» лиц анимированных киногероев

Весной Soul Machines выпустила новую цифровую сотрудницу — робота Рейчел, созданную для консультирования клиентов банков. А в июле компания объявила еще о двух новых продуктах — аватарах Шушилле и Романе, первом мужчине в коллекции Soul Machines. Характерные черты робота — например, его внешность, возраст и пол — выбирают заказчики.

Технологии IBM используются не в каждом продукте, но на этом тоже может настоять покупатель — например, если он применяет их для других нужд и уже является клиентом IBM Watson. Soul Machines также может использовать другие платформы искусственного интеллекта — Google Brain, Miscrosoft Cortana, Amazon Lex. Сейчас на создание одного аватара уходит шесть-восемь недель, еще тришесть месяцев отводится на тестирование и обучение робота в пилотном режиме. В компании работает около 40 человек, большинство из них — инженеры, нейрофизиологи, программисты и лингвисты.

По словам Кросса, Soul Machines разрабатывает цифровых сотрудников для крупных международных компаний, но имена заказчиков и стоимость контрактов он не называет. Кросс лишь уточнил, что нынешние клиенты стартапа — компании из банковской, автомобильной отраслей и IT из Новой Зеландии, Австралии, Японии, США и Европы. Помощники обычно предназначены для работы с клиентами, продаж и маркетинга.

Улучшенная версия себя

Коммуникация между людьми на 70–90% состоит из невербальных средств, и цифровые роботы должны уметь использовать в общении мимику и жесты, говорит Джаред Петерс, представитель запущенного в июле в США стартапа Expressive.AI. Компания тоже разрабатывает виртуальных помощников — как анимационных, так и реалистичных — для заказчиков из сферы цифровой медицины и образования. Похожими технологиями с 2014 года занимается и американский стартап ObEN, который разрабатывает, в частности, виртуальные копии знаменитостей для общения с поклонниками. В ноябре 2016-го практически одновременно с Soul Machines проект привлек $7,7 млн от пула из десяти инвесторов (позже — еще $5 млн). ObEN создает 3D-модель человека по фотографии и записывает его голос, которым будет разговаривать и даже петь аватар, рассказал журналу РБК сооснователь и гендиректор компании Никхил Джайн. Роботы будут использоваться в приложениях виртуальной и дополненной реальности, мобильных приложениях и играх.

Кроме знаменитостей среди заказчиков ObEN — компании из сферы здравоохранения, образования и игр (конкретных названий в стартап-проекте также не раскрывают). Вскоре ObEN планирует принимать заказы на создание виртуальных копий человека от всех желающих. Аватар будет «выглядеть, звучать и думать», как его «хозяин», и сможет от его имени выполнять дела, на которые у человека нет времени. Ни ObEN, ни Expressive не раскрывают финансовые показатели.

Кросс также не стал озвучивать конкретных цифр по Soul Machines, уточнив лишь, что у компании есть выручка и она «быстро растет». В 2018 году стартап планирует привлечь новый раунд инвестиций, в котором должны принять участие как нынешние, так и новые инвесторы, говорит топ-менеджер.

Soul Machines, как и ObEN, в ближайшем будущем собирается создавать цифровые копии знаменитостей, чтобы фанаты могли с ними разговаривать, рассказал Кросс. Кроме того, стартап работает с компанией — производителем игрушек, чтобы «оживить» героев для общения с детьми в виртуальной среде. В ближайший год разработчики новозеландской компании планируют сократить время создания одного цифрового робота до пары недель, а в конечном счете аватар должен создаваться за один день, делитсяпланами Кросс. В следующем году клиенты Soul Machines смогут самостоятельно конструировать нужных им цифровых работников в специальной программе.

Для нынешних заказчиков человекоподобные роботы — первые цифровые сотрудники, но в будущем, уверен Кросс, у компаний их будет множество. Их клиенты смогут выбрать, с каким именно представителем они хотят говорить — мужчиной или женщиной, китайцем или испанцем, на каком языке они будут общаться.

Потенциал использования человекоподобных аватаров огромен, единодушны собеседники журнала РБК. Вскоре появятся и цифровые учителя, особенно в тех районах, где не хватает реальных педагогов и школ. Также аватары смогут помогать работать с беженцами во время миграционных кризисов, перечисляет Кросс.

Джайн из ObEN считает, что скоро у каждого человека в мире будет собственный аватар, основанный на искусственном интеллекте. Кросс согласен, что не пройдет и десяти лет, как на рабочие встречи за людей будут «ходить» их цифровые копии. «Это многомиллиардный рынок», — уверен он.

Рынок виртуальных цифровых помощников к 2021 году

$15,8 млрд суммарной выручки

1,8 млрд частных пользователей

843 млн корпоративных пользователей

Источник: прогноз Research and Markets

Фото: Из архива пресс-службы компании Soul Machines

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Клубный респаун Клубный респаун

Кто и зачем пытается возродить компьютерные клубы

РБК
Тарон Эджертон Тарон Эджертон

Он уже готовится к премьере нового фильма об агентах секретной службы

L’Officiel
Балетные страсти Балетные страсти

Слабость к балеринам питал ещё император Николай I

Дилетант
Ах, какое блаженство Ах, какое блаженство

У Блейк Лайвли есть все, что нужно, чтобы называться совершенством

Glamour
Электрическая ракета, которая изменит войну Электрическая ракета, которая изменит войну

Барражирующие боеприпасы «Ланцет», которые могут в корне изменить войны будущего

Популярная механика
От Любови до ненависти От Любови до ненависти

Как реагировать на хейтеров?

Cosmopolitan
«Зачем искусственному интеллекту уметь думать?» «Зачем искусственному интеллекту уметь думать?»

Интервью с Михаилом Биленко, «Яндекс»

РБК
Игра на выбегание Игра на выбегание

Джордж Пендл отправляется в Теннесси на марафон протяженностью 160 километров

Esquire
Александр Ревва: Теперь я знаю о женщинах все!!! Александр Ревва: Теперь я знаю о женщинах все!!!

О том, кто на самом деле скрываетcя под маской секс-символа Артура Пирожкова

Лиза
Иногда не сдавайся! Иногда не сдавайся!

Сейчас чуть ли не полпланеты страдает синдромом выученной беспомощности

Maxim
По щелчку По щелчку

Когда какой-то из органов чувств не работает как надо

GEO
Гипноз: впадаем в детство Гипноз: впадаем в детство

Как именно работает гипнотерапия и кому она доступна?

Psychologies
«Из жизни ребенка исчез интересный взрослый» «Из жизни ребенка исчез интересный взрослый»

Как создать школьнику ситуацию развития

Русский репортер
Доброе утро Доброе утро

Начинаем день простой практикой, чтобы успокоить эмоции и не допустить стресса

Yoga Journal
Михаил Гуцериев:  «В России на семейный бизнес смотрят как на мафиозный клан» Михаил Гуцериев:  «В России на семейный бизнес смотрят как на мафиозный клан»

Интервью с Михаилом Гуцериевым

Forbes
Isuzu D-Max – Mitsubishi L200 Isuzu D-Max – Mitsubishi L200

Выбор пикапов на российском рынке невелик

АвтоМир
Осторожно! Прекрасный пол Осторожно! Прекрасный пол

Когда-то женщина считалась врагом человека, ею пугали мальчиков на ночь глядя

Maxim
Завтра я первоклассник! Завтра я первоклассник!

Eще чуть-чуть – и твой малыш будет первоклассником

Лиза
Повелители мира Повелители мира

О том, как кошки воспользовались людьми, чтобы завоевать планету

GEO
Зеркало локального конфликта Зеркало локального конфликта

Почему мы спорим о политике?

Psychologies
Татьяна Рыжова, Алексей Вейтков: Наш Татьяна Рыжова, Алексей Вейтков: Наш

На встречах со зрителями Иван Рыжов шутил: "Мое амплуа — старик"

Караван историй
Театр военных действий Театр военных действий

В сентябре весь мир вспоминает жертв террора

Glamour
Выйти из декрета Выйти из декрета

Ребенок уже подрос, а мысль о возвращении в ряды работающих мам все равно пугает

Домашний Очаг
Чтение и перезапись мозга Чтение и перезапись мозга

Через пять лет появится работающее устройство для чтения мыслей и воспоминаний

Популярная механика
Тень выборов Тень выборов

Что происходит в закулисье избирательной кампании. Наблюдения очевидца

Огонёк
Снижаем расходы на коммуналку Снижаем расходы на коммуналку

Научившись разумно экономить, ты можешь уменьшить затраты в разы!

Лиза
Girl Talk: Анна Меликян Girl Talk: Анна Меликян

Автор премьеры месяца «Про любовь. Только для взрослых»

SNC
Китайская грамота Китайская грамота

Коллекция китайского фарфора

AD
Лицо со шрамом Лицо со шрамом

Главный «таксист» французского кино Сами Насери

GALA Биография
Лана Дель Рей: женщина, которая жаждет покоя Лана Дель Рей: женщина, которая жаждет покоя

Лана Дель Рей не любит рассказывать прессе, что работала в социальной службе

Esquire
Открыть в приложении