Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Наука в мире фэнтези: как Брендон Сандерсон создает магические системы Наука в мире фэнтези: как Брендон Сандерсон создает магические системы

Магия и наука – это полные противоположности? Нет!

Популярная механика
Что делать, если не получается достичь баланса между работой и личной жизнью Что делать, если не получается достичь баланса между работой и личной жизнью

Баланс между работой и личной жизнью – в вашем гардеробе

GQ
Как можно использовать искусственный интеллект для создания видео? Интересные факты Как можно использовать искусственный интеллект для создания видео? Интересные факты

Как работают ИИ-видеогенераторы, где их применяют и что ждет нас в будущем

ТехИнсайдер
10 вопросов о здоровом сне 10 вопросов о здоровом сне

Во сколько правильнее всего ложиться в постель, как бороться с бессонницей?

Лиза
Как научиться принимать комплименты Как научиться принимать комплименты

Почему бывает трудно принимать комплименты и как с этим справиться

Inc.
Близкий человек обманул. Что делать? Близкий человек обманул. Что делать?

Что делать, если близкий человек сказал нам неправду?

Psychologies
Самые мрачные здания и сооружения со всего мира (инфернальная подборка) Самые мрачные здания и сооружения со всего мира (инфернальная подборка)

Самые жуткие представители архитектуры

Maxim
Гуайява, сладкий плод с экзотическим ароматом Гуайява, сладкий плод с экзотическим ароматом

История экзотического фрукта гуавы

Наука и жизнь
Аксолотль: вечное детство Аксолотль: вечное детство

Аксолотль может размножаться, оставаясь ребенком

Вокруг света
Дома, которые строит Ким Дома, которые строит Ким

Почему французские боссы так доверяют британскому дизайнеру Киму Джонсу

Robb Report
Отдать нельзя пользоваться: как вернуть вещи в магазин, рассказывает юрист Отдать нельзя пользоваться: как вернуть вещи в магазин, рассказывает юрист

Как вернуть купленную вещь обратно в магазин?

Cosmopolitan
Imagine Джона Леннона как отражение главных идей Конфуция. Отрывок из книги Imagine Джона Леннона как отражение главных идей Конфуция. Отрывок из книги

Чему стоит поучиться у Марка Аврелия, Руссо, Ницше и других мыслителей

СНОБ
Незнакомая знакомая Турция Незнакомая знакомая Турция

У самой границы с Сирией Турция предстает перед туристами совершенно неожиданной

Здоровье
Режиссер. Данила Козловский Режиссер. Данила Козловский

Данила Козловский вновь в режиссерском кресле и вновь с наградой

GQ
Тайная свадьба, аборт и «голая» съемка: 5 удивительных фактов о Миле Йовович Тайная свадьба, аборт и «голая» съемка: 5 удивительных фактов о Миле Йовович

Жизнь американской актрисы Милы Йовович похожа на американские горки

VOICE
Продукты против старения Продукты против старения

Как с помощью рациона замедлить естественные возрастные изменения?

Лиза
Анна Нетребко. Дива в шортах Анна Нетребко. Дива в шортах

Анна Нетребко — первое сопрано мира

СНОБ
С кем женщины категории MILF предпочитают заниматься сексом? С кем женщины категории MILF предпочитают заниматься сексом?

Почему «Пум» становится все больше и как мы к этому относимся?

Maxim
Лучшее — детям Лучшее — детям

Кирилл Истомин оформил квартиру для своих друзей и их троих сыновей

AD
В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет

Древние люди систематически обрабатывали останки слонов

N+1
Спасибо, папа Спасибо, папа

С папой в детстве я встречалась редко, хотя номинально он еще жил дома

Seasons of life
Соленый чай и Розовое озеро: зачем ехать в Калмыкию в любое время года Соленый чай и Розовое озеро: зачем ехать в Калмыкию в любое время года

Калмыкия — это бескрайние равнины и буддийское спокойствие

РБК
Судьба писателя: фильмы только про мастеров слова Судьба писателя: фильмы только про мастеров слова

Фильмы о том, как жить с даром создавать литературные произведения

GQ
Страх неизвестности Страх неизвестности

Как решиться на перемены и не пожалеть об этом

Лиза
Что может превратить человека в чудовище? Репортаж со съемок сериала «Самка богомола». Эксклюзив «Сноба» Что может превратить человека в чудовище? Репортаж со съемок сериала «Самка богомола». Эксклюзив «Сноба»

«Самка богомола» — проект о психических травмах, которые могут изменить человека

СНОБ
Павел Воля: «Я очень деятельная мартышка» Павел Воля: «Я очень деятельная мартышка»

Павел Воля о чувстве одиночества, музе и алкоголе в жизни поэта

Cosmopolitan
Сколько на чай оставлять заправщику на АЗС и оставлять ли вообще. Отвечаем на три главных вопроса Сколько на чай оставлять заправщику на АЗС и оставлять ли вообще. Отвечаем на три главных вопроса

Как не выглядеть жлобом на АЗС и не разориться одновременно

Maxim
Почему работать на одном месте больше трёх лет нормально Почему работать на одном месте больше трёх лет нормально

Причины, по которым абсолютно нормально работать много лет на одном месте

Популярная механика
«Я и Брэдли очень строгие»: Ирина Шейк о воспитании 4-летней дочери от Купера «Я и Брэдли очень строгие»: Ирина Шейк о воспитании 4-летней дочери от Купера

Ирина Шейк рассказала об отношениях с бывшим возлюбленным и их ребенком

Cosmopolitan
Большая чистка: как Голливуд переваривает культуру отмены Большая чистка: как Голливуд переваривает культуру отмены

«Культура отмены», или бойкот публичной персоны

РБК
Открыть в приложении