Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Комедии, фильмы из детства и «Властелин колец»: как вылечить весеннюю апатию с помощью кино Комедии, фильмы из детства и «Властелин колец»: как вылечить весеннюю апатию с помощью кино

Как хорошее кино может помочь справиться с плохим настроением?

Популярная механика
Новенькие из XO Team Новенькие из XO Team

Новые тиктокеры из XO Team

ЖАРА Magazine
Чем больше контента вы смотрите, тем хуже для психического здоровья Чем больше контента вы смотрите, тем хуже для психического здоровья

Чем больше времени вы проводите в сети, тем хуже становится психическое здоровье

ТехИнсайдер
Детка, ты не космос! Почему богатейший гений мира Илон Маск несчастлив в любви Детка, ты не космос! Почему богатейший гений мира Илон Маск несчастлив в любви

Почему космический гений так и не может найти свою постоянную «орбиту»

Cosmopolitan
3 фактора, снижающих либидо у женщин: что делать 3 фактора, снижающих либидо у женщин: что делать

Что влияет на женское либидо и получение удовольствия от секса?

Psychologies
Госприложение для защиты от спама в Китае «сдавало» властям читателей Bloomberg и других иностранных сайтов с новостями Госприложение для защиты от спама в Китае «сдавало» властям читателей Bloomberg и других иностранных сайтов с новостями

Через антифрод-приложения китайская полиция допрашивает граждан

VC.RU
5 признаков опытного манипулятора 5 признаков опытного манипулятора

Моменты, которые могли бы вас насторожить и предостеречь: рядом манипулятор

Psychologies
Деньги не главное: как менялась одна из богатейших женщин страны Елена Батурина Деньги не главное: как менялась одна из богатейших женщин страны Елена Батурина

Какими были публичные образы одной из богатейших женщин страны

Cosmopolitan
Семь детективных историй из практики британского нейропсихиатра. Отрывок из книги Семь детективных историй из практики британского нейропсихиатра. Отрывок из книги

Глава из книги «Глядя в бездну. Заметки нейропсихиатра о душевных расстройствах»

СНОБ
«Вот и всё. Зачем мы пугаем себя концом света?» «Вот и всё. Зачем мы пугаем себя концом света?»

Конец, который предсказывают нам большинство ученых

N+1
Калькуляция любви: почему важно считать деньги в отношениях Калькуляция любви: почему важно считать деньги в отношениях

Как деньги превратились в антипод любви и почему это нужно исправить

Cosmopolitan
Существует ли игровая зависимость и как часто она встречается Существует ли игровая зависимость и как часто она встречается

Как часто встречается игровая зависимость, и лечат ли ее?

Популярная механика
Круиз для коров: как работает водоплавающая молочная ферма Круиз для коров: как работает водоплавающая молочная ферма

Cюрреалистическое зрелище: стадо коров, жующих сено на борту большого судна

Популярная механика
Стас Круглицкий — о суперспособности Сантаны, буллинге и Большом театре Стас Круглицкий — о суперспособности Сантаны, буллинге и Большом театре

Стас Круглицкий — как совмещает перфекционизм и лень

РБК
Электрический УАЗ едет на экспорт Электрический УАЗ едет на экспорт

Этот УАЗ хотят заполучить в свои автопарки клиенты из Великобритании и Германии

Эксперт
Как правильно пить таблетки: большой и подробный гид по приему лекарств Как правильно пить таблетки: большой и подробный гид по приему лекарств

Почему лекарства следует пить строго по инструкции?

Cosmopolitan
Скромность не украшает. Тест-драйв Audi RS Q8 Скромность не украшает. Тест-драйв Audi RS Q8

Что вы получите, купив Audi RS Q8

РБК
Как рыба в воде Как рыба в воде

Как этот юноша с горящим взором стал главной кинозвездой, прямо здесь и сейчас

Glamour
Девушку-подростка увезли в больницу с аппендицитом, а она начала рожать Девушку-подростка увезли в больницу с аппендицитом, а она начала рожать

Аппендицит Нади Роадс из Огайо оказался беременностью

Cosmopolitan
Танцы с пиками Танцы с пиками

Как Эйзенштейн планировал оправдать Сталина, а в результате его обличил

Weekend
Макаронам нужен твердый злак Макаронам нужен твердый злак

Производители макарон просят запретить экспорт твердой пшеницы

Эксперт
Юра Борисов — о режиссерах, их мирах, импровизации и опыте Юра Борисов — о режиссерах, их мирах, импровизации и опыте

Юра Борисов считает, что если за что-то и браться, то только по любви

РБК
«Стресс, боль и опиоиды. Об эндорфинах и не только» «Стресс, боль и опиоиды. Об эндорфинах и не только»

Сергей Парин — что такое боль и чем она отличается от других ощущений?

N+1
«Я разрыдалась, мерзко!»: Катина, Кошкина и другие звезды о встречах с маньяками «Я разрыдалась, мерзко!»: Катина, Кошкина и другие звезды о встречах с маньяками

Звездные героини нашей статьи столкнулись лицом к лицу с маньяками

Cosmopolitan
Дмитрий Бертман: Дмитрий Бертман:

Режиссер Дмитрий Бертман — о работе в театре, "Геликон-опере" и спектаклях

Караван историй
«Кости: внутри и снаружи» «Кости: внутри и снаружи»

Отрывок из книги хирурга-ортопеда Роя Миллза «Кости: внутри и снаружи»

N+1
Союз рыжих: как лисы стали привычными дикими спутниками человека Союз рыжих: как лисы стали привычными дикими спутниками человека

Шаг за шагом они подбираются к человеку

Вокруг света
Ешь, спи, касайся: 7 простых способов сделать брак идеальным Ешь, спи, касайся: 7 простых способов сделать брак идеальным

Что надо делать, чтобы сохранить брак на долгие годы

Cosmopolitan
Убить время, похоронить эпоху Убить время, похоронить эпоху

Что сделало «Клан Сопрано» первым современным сериалом

Weekend
Почему вы вечно ничего не успеваете Почему вы вечно ничего не успеваете

Несколько не самых очевидных факторов, из-за которых вы ничего не успеваете

GQ
Открыть в приложении