Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Конаковская ГРЭС: титан советской энергетики Конаковская ГРЭС: титан советской энергетики

Конаковская ГРЭС издали выглядит как большой трехмачтовый корабль

Популярная механика
Как отец и сын придумали игровую консоль в виде куба и собрали предзаказы на $39 млн Как отец и сын придумали игровую консоль в виде куба и собрали предзаказы на $39 млн

WowCube — кубик Рубика нового поколения

Forbes
Японцы сделали робоверсию ожившего трехногого стула из аниме Японцы сделали робоверсию ожившего трехногого стула из аниме

Инженеры воспроизвели оживший стул без одной ноги и научили его ходить

N+1
Как распознать партнера, склонного к эмоциональному насилию Как распознать партнера, склонного к эмоциональному насилию

Что такое эмоциональное насилие и как распознать абьюзера?

Psychologies
18 цитат Казановы, которые должен знать каждый мужчина 18 цитат Казановы, которые должен знать каждый мужчина

Пусть эти цитаты превратят вас в Казанову: великого любовника и путешественника

Maxim
Почему космический полет Ричарда Брэнсона мог обернуться катастрофой Почему космический полет Ричарда Брэнсона мог обернуться катастрофой

Экипаж корабля Брэнсона через минуту после взлета получил сигнал об ошибке

GQ
Некоторые мошенники перестали сами взламывать компании: им проще поделиться выкупом с сообщником «изнутри» Некоторые мошенники перестали сами взламывать компании: им проще поделиться выкупом с сообщником «изнутри»

Мошенники предлагают запустить вредоносное ПО на корпоративных серверах

VC.RU
Муж и жена спят раздельно: как это сказывается на отношениях в семье Муж и жена спят раздельно: как это сказывается на отношениях в семье

Могут ли супруги спать в разных кроватях?

Psychologies
Я, оно и сверх-я Я, оно и сверх-я

До чего доведет развитие искусственного интеллекта?

Цифровой океан
Должны ли у ребенка быть обязанности Должны ли у ребенка быть обязанности

Если ребенок загружен с утра до ночи учебой — должен ли он еще мыть посуду?

СНОБ
Вопрос, который надо задавать каждый день, и еще 4 способа сохранить отношения Вопрос, который надо задавать каждый день, и еще 4 способа сохранить отношения

Простые правила, которые позволят вам сохранить союз на долгие годы

Cosmopolitan
Еда два раза в день, работа стоя. Рутина Андрея Беловешкина Еда два раза в день, работа стоя. Рутина Андрея Беловешкина

Методы самооптимизации врача, который ведет блог о здоровом образе жизни

Reminder
6 вопросов, которые часто звучат в счастливых парах 6 вопросов, которые часто звучат в счастливых парах

Как парам удается поддерживать пламя страсти долгие годы

Psychologies
Поступь конца света: почему ученые говорят об опасности нового массового вымирания? Поступь конца света: почему ученые говорят об опасности нового массового вымирания?

Массовое вымирание – событие, которое сопровождается узнаваемыми явлениями

Популярная механика
Чертова дюжина: 13 автомобилей с провальным дизайном Чертова дюжина: 13 автомобилей с провальным дизайном

Автомобили, которые удивляют своим внешним видом

CHIP
Таких берут в космонавты Таких берут в космонавты

Устарела ли элементная база современных марсоходов

Цифровой океан
Хвост сэкономил динозавру энергию при ходьбе Хвост сэкономил динозавру энергию при ходьбе

Ученые выяснили, что хвост динозавра позволял экономить энергию

N+1
10 дутых фактов о жевательной резинке 10 дутых фактов о жевательной резинке

Самые интересные факты о жвачке

Maxim
Существует ли игровая зависимость и как часто она встречается Существует ли игровая зависимость и как часто она встречается

Как часто встречается игровая зависимость, и лечат ли ее?

Популярная механика
10 советов, следуя которым вы будете обречены на богатство 10 советов, следуя которым вы будете обречены на богатство

10 советов, следуя которым вы будете обречены на успех

GQ
Английский зверобой: что такое «Шерман-Файрфлай» Английский зверобой: что такое «Шерман-Файрфлай»

Эта вспышка была последним, что видели немецкие танкисты

Maxim
На Сардинии нашли зуб кашалота со следами обработки возрастом более пяти тысяч лет На Сардинии нашли зуб кашалота со следами обработки возрастом более пяти тысяч лет

Древнейший артефакт нашли на острове Сардиния

N+1
Ловушка для родителей Ловушка для родителей

Эмоциональное выгорание родителей – как восстановить баланс?

Здоровье
7 самых смешных и опасных типажей клиентов в фитнес-клубе: берегись! 7 самых смешных и опасных типажей клиентов в фитнес-клубе: берегись!

Шесть типажах фитнес-клиентов, которых ты встретишь в каждом клубе

VOICE
Факты и правда о фильмах «Брат» и «Брат-2» Факты и правда о фильмах «Брат» и «Брат-2»

Изнанка фильмов «Брат» и «Брат-2»

Maxim
25 выдуманных фактов, которые звучат чертовски правдоподобно (и многие в них верят) 25 выдуманных фактов, которые звучат чертовски правдоподобно (и многие в них верят)

После прочтения этих фактов ты рискуешь потерять связь с реальностью

Maxim
Актер. Иван Янковский Актер. Иван Янковский

Как внук Олега Янковского на глазах превращается в актера Ивана Янковского

GQ
«Язык не поворачивался назвать ее мамой». Истории сироты и матери, лишенной ребенка «Язык не поворачивался назвать ее мамой». Истории сироты и матери, лишенной ребенка

Почему детям лучше оставаться в родной семье? Реальные истории

СНОБ
Московская киновселенная: фильмы только о столице Московская киновселенная: фильмы только о столице

Фильмы, снятые в Москве и вдохновленные ею

GQ
Правильное молоко для вкусового сыра Правильное молоко для вкусового сыра

Компания «Русский сыр» запустила вторую молочную мегаферму в Калужской области

Эксперт
Открыть в приложении