Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Доставка в космос: как на орбиту доставляют малые грузы и зачем там дата-центр Доставка в космос: как на орбиту доставляют малые грузы и зачем там дата-центр

Возможна ли доставка квадрокоптерами не на близлежащую улицу, а в космос?

Популярная механика
«Я и Брэдли очень строгие»: Ирина Шейк о воспитании 4-летней дочери от Купера «Я и Брэдли очень строгие»: Ирина Шейк о воспитании 4-летней дочери от Купера

Ирина Шейк рассказала об отношениях с бывшим возлюбленным и их ребенком

Cosmopolitan
Сигма я или тварь дрожащая: что означает новое слово из молодежного сленга Сигма я или тварь дрожащая: что означает новое слово из молодежного сленга

Что представляют собой «сигмы»? Можно ли кого-то этим оскорбить?

Psychologies
«Андрюша» — брат «Катюши»: история реактивного миномета БМ-31 «Андрюша» — брат «Катюши»: история реактивного миномета БМ-31

Ближайший родственник «Катюши» — родной брат, «Андрюша»

Maxim
Как уйти от психологии бедняка: 4 лайфхака Как уйти от психологии бедняка: 4 лайфхака

Разбираемся, как перестать нищебродствовать и начать жить

Maxim
Очень тяжелые носители: как Starship изменит облик космонавтики XXI века Очень тяжелые носители: как Starship изменит облик космонавтики XXI века

Как Илон Маск меняет космонавтику XXI века

Популярная механика
Создал ледовый комбайн в 50, а вместе с ним и рынок таких машин, который сразу захватил — это изобретатель Фрэнк Замбони Создал ледовый комбайн в 50, а вместе с ним и рынок таких машин, который сразу захватил — это изобретатель Фрэнк Замбони

Почему ледозаливочные машины других производителей по ошибке называют «Замбони»

VC.RU
Русский «Улисс»: каким получился фильм «Петровы в гриппе» Серебренникова Русский «Улисс»: каким получился фильм «Петровы в гриппе» Серебренникова

Критик Ярослав Забалуев делится впечатлениями о фильме «Петровы в гриппе»

РБК
13 лет рабства: что рассказал о Бритни Спирс новый фильм Netflix 13 лет рабства: что рассказал о Бритни Спирс новый фильм Netflix

«Бритни против Спирса» — фильм для любителей дотошных криминальных процедуралов

РБК
Степняки начали пить молоко пять тысяч лет назад Степняки начали пить молоко пять тысяч лет назад

Ученые нашли молочные белки в зубном камне представителей ямной культуры

N+1
Как учится поколение Z? Заменит ли YouTube университеты? Спикеры фестиваля G8 рассуждают о будущем образования Как учится поколение Z? Заменит ли YouTube университеты? Спикеры фестиваля G8 рассуждают о будущем образования

Что происходит с образованием в России прямо сейчас?

Esquire
Почему Китай ополчился на BTS, Blackpink и другой корейский поп Почему Китай ополчился на BTS, Blackpink и другой корейский поп

Амбассадоры коммунизма не дремлют

GQ
Почему расстаться трудно? Психолог — о созависимых отношениях Почему расстаться трудно? Психолог — о созависимых отношениях

Как отличить просто несчастливый союз от созависимых отношений?

РБК
У вас такие странные взрослые — с ними даже можно разговаривать У вас такие странные взрослые — с ними даже можно разговаривать

Наталья Вираховская о плейбэк-театре в «Большой Перемене»

ПУСК
Режиссер. Данила Козловский Режиссер. Данила Козловский

Данила Козловский вновь в режиссерском кресле и вновь с наградой

GQ
Остров-сад Остров-сад

Нило-Столобенская пустыня

Seasons of life
Существует ли игровая зависимость и как часто она встречается Существует ли игровая зависимость и как часто она встречается

Как часто встречается игровая зависимость, и лечат ли ее?

Популярная механика
Как не попасть на удочку мошенников Как не попасть на удочку мошенников

Правила цифровой гигиены, чтобы не стать жертвой мошенников

Эксперт
«Казалось, что я в гробу и в крышку молотками заколачивают гвозди». Как была устроена карательная психиатрия в СССР «Казалось, что я в гробу и в крышку молотками заколачивают гвозди». Как была устроена карательная психиатрия в СССР

Отрывок из книги «Девятый круг. Одиссея диссидента в психиатрическом ГУЛАГе»

СНОБ
Марс и Венера Марс и Венера

Телеведущая Юлия Барановская вышла в открытый космос в Иордании

Tatler
15 мыслей Евгения Стычкина 15 мыслей Евгения Стычкина

Евгений Стычкин – о кино, театре, режиссуре и о жизни

GQ
Как помочь родителям, потерявшим ребенка во время беременности Как помочь родителям, потерявшим ребенка во время беременности

Как помочь пережить горе тем, кто столкнулся с перинатальной потерей

Psychologies
Бизнес по-женски: опыт Лены Лежневой, основательницы бренда Lelu Kids Бизнес по-женски: опыт Лены Лежневой, основательницы бренда Lelu Kids

Как стать успешной в своем деле: основательница бренда детских платьев

Cosmopolitan
Секс из машины Секс из машины

«Титан», невероятный победитель Каннского фестиваля

Weekend
Потерять килограммы, но не растерять друзей Потерять килограммы, но не растерять друзей

Начав худеть, многие удивляются, что ряды друзей изрядно поредели

Здоровье
Открытие. Imanbek Открытие. Imanbek

Imanbek вспоминает, как сделал трек за два часа и получил «Грэмми»

GQ
8 неизвестных сериалов по книгам Агаты Кристи 8 неизвестных сериалов по книгам Агаты Кристи

Достойные многосерийные сериалы, снятые по книгам «королевы детектива»

Psychologies
8 самых французских фактов о фильме «Амели» 8 самых французских фактов о фильме «Амели»

Почему все так любят «Амели»?

Maxim
Голливудское гадание румпология: как предсказать судьбу по форме ягодиц Голливудское гадание румпология: как предсказать судьбу по форме ягодиц

Как узнать свое будущее, посмотрев на саму себя ниже пояса

Cosmopolitan
Незнакомая знакомая Турция Незнакомая знакомая Турция

У самой границы с Сирией Турция предстает перед туристами совершенно неожиданной

Здоровье
Открыть в приложении