Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Полезные привычки для здоровья мозга: 5 советов, к которым стоит прислушаться Полезные привычки для здоровья мозга: 5 советов, к которым стоит прислушаться

Отрывок из книги Джона Рэндольфа «Таблетка для мозга»

Популярная механика
Ветер перемен Ветер перемен

Современная история о морских путешествиях в интерьере московской квартиры

SALON-Interior
Минус вайб Минус вайб

Чем опасно доверять написание кода нейросетям?

N+1
Молекулы предложили переводить в хиральную суперпозицию Молекулы предложили переводить в хиральную суперпозицию

Физики описали молекулы в квантовой суперпозиции

N+1
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Как получить то, чего хочешь от жизни: 15 важных советов Как получить то, чего хочешь от жизни: 15 важных советов

Универсального рецепта счастья, конечно, не существует

Cosmopolitan
Как учится поколение Z? Заменит ли YouTube университеты? Спикеры фестиваля G8 рассуждают о будущем образования Как учится поколение Z? Заменит ли YouTube университеты? Спикеры фестиваля G8 рассуждают о будущем образования

Что происходит с образованием в России прямо сейчас?

Esquire
Краткая (очень) история секса в российском кино Краткая (очень) история секса в российском кино

Секс в отечественном кино: поворотные моменты и фильмы

РБК
Во сто карат: как бриллиант стал символом помолвок и надежной инвестицией Во сто карат: как бриллиант стал символом помолвок и надежной инвестицией

Бриллианты не то, чем вам кажутся

Esquire
Ваши отношения с едой Ваши отношения с едой

Как вы обращаетесь с едой и как привести отношения к гармонии?

Домашний Очаг
Черная вдова: пожилая женщина отравила мужа и трех любовников ради денег Черная вдова: пожилая женщина отравила мужа и трех любовников ради денег

Женщина, несмотря на преклонный возраст, много лет проворачивала брачные аферы

Cosmopolitan
Режиссер. Данила Козловский Режиссер. Данила Козловский

Данила Козловский вновь в режиссерском кресле и вновь с наградой

GQ
«Чувствуешь ли ты, что в чем-то до сих пор виноват?» Психолог Александр Рязанцев — о том, как пережить утрату «Чувствуешь ли ты, что в чем-то до сих пор виноват?» Психолог Александр Рязанцев — о том, как пережить утрату

Отрывок из книги Александра Рязанцева — о стадиях и способах переживания горя

СНОБ
Отцовская забота – кальмары спариваются с самками и уплывают, но до этого находят “квартиру” для будущих детей Отцовская забота – кальмары спариваются с самками и уплывают, но до этого находят “квартиру” для будущих детей

Самцы кальмаров могут проявлять заботу по отношению к своему потомству

Популярная механика
5 скандальных премьер, которые позже стали классикой 5 скандальных премьер, которые позже стали классикой

О том, как переживали неудачи Гоголь, Чайковский, Глинка, Чехов и Стравинский

Культура.РФ
Вокруг гномы и карлики: психическое заболевание с очень странными галлюцинациями Вокруг гномы и карлики: психическое заболевание с очень странными галлюцинациями

Знаешь историю про Гулливера? Возможно, Джонатан Свифт её не выдумал

Cosmopolitan
Невечный покой Невечный покой

Истории людей, переживших клиническую смерть

Psychologies
Уик-энд среди звезд Уик-энд среди звезд

Именно космический туризм может вдохнуть жизнь в пилотируемую космонавтику

Вокруг света
7 практик, которые помогут развить харизму 7 практик, которые помогут развить харизму

Как стать тем, кому хотят подражать, кем бесконечно восхищаются окружающие?

Psychologies
Семейные традиции: по чьему сценарию мы живем и как его изменить? Семейные традиции: по чьему сценарию мы живем и как его изменить?

Мы думаем, что наша жизнь — это результат наших решений и действий, так ли это?

Psychologies
Пробежка с предпринимателем: Как бег помогает справиться с выгоранием и можно ли настроить баланс между работой и жизнью Пробежка с предпринимателем: Как бег помогает справиться с выгоранием и можно ли настроить баланс между работой и жизнью

О том, как совмещать предпринимательство с личной жизнью

VC.RU
«Вам предстоит колоссальная работа»: отрывок из книги «Страх и надежды» Эрика Ларсона «Вам предстоит колоссальная работа»: отрывок из книги «Страх и надежды» Эрика Ларсона

В 1940 году Адольф Гитлер вторгся в Голландию и Бельгию

Вокруг света
Факты и правда о фильмах «Брат» и «Брат-2» Факты и правда о фильмах «Брат» и «Брат-2»

Изнанка фильмов «Брат» и «Брат-2»

Maxim
«Люди врут, чтобы понравиться»: как сценарист Майкл Левитон перестал говорить правду «Люди врут, чтобы понравиться»: как сценарист Майкл Левитон перестал говорить правду

Сценарист Майкл Левитон: почему правда — не лучший помощник

Forbes
Негатив, конфликты, боты: как работает управление репутацией в интернете Негатив, конфликты, боты: как работает управление репутацией в интернете

Что такое работа с репутацией

Inc.
Перестаньте говорить детям эти 4 фразы, если хотите научить их самодисциплине — нейробиологи Перестаньте говорить детям эти 4 фразы, если хотите научить их самодисциплине — нейробиологи

Что нельзя говорить родителям, если они хотят воспитать в детях самодисциплину

Inc.
Агриппина Стеклова: «Чем больше опыта, тем больше страхов и сомнений» Агриппина Стеклова: «Чем больше опыта, тем больше страхов и сомнений»

Актриса рассказала «Здоровью» о лучшем фитнесе в своей жизни и новом увлечении

Здоровье
Зачем российским учёным виртуальный ядерный реактор Зачем российским учёным виртуальный ядерный реактор

НИЯУ МИФИ разрабатывают комплексный цифровой двойник учебного ядерного реактора

Популярная механика
Потеряла 25 кг и мужа: как кетодиета разрушила мой брак Потеряла 25 кг и мужа: как кетодиета разрушила мой брак

Не все ожидают, что соблюдение диеты спровоцирует разрыв длительных отношений

Cosmopolitan
Музыкальная станция Akai MPC — «коробочка, похожая на Nintendo», которая заменила собой музыкальную студию Музыкальная станция Akai MPC — «коробочка, похожая на Nintendo», которая заменила собой музыкальную студию

Как благодаря Akai Music Production появились музыканты-продюсеры

VC.RU
Открыть в приложении