11.06.08 |
Робот Asimo научился распознавать речь сразу трех человек
|
На Международной конференции робототехники и автоматики (ICRA 2008) была представлена программа HARK (HRI-JP Audition for Robots with Kyoto University) для робота Asimo, которую написали Хироши Окуно (Hiroshi Okuno) из университета г. Киото и Кадзухиро Накадаи (Kazuhiro Nakadai) из исследовательского подразделения компании Honda. HARK позволяет отличать голоса собеседников с точностью 70-80%. Заявленная авторами точность распознавания достигается лишь в идеальных условиях. Когда разработчики решили опробовать Asimo в обстановке шумного зала и три человека одновременно выкрикивали свой заказ официанту, точность распознавания едва достигала 30-40%, сообщает soft.mail.ru со ссылкой на NewScientist.
Система HARK использует сборку из 8 микрофонов, чтобы определить, откуда слышится каждый из голосов. Кроме того, система позволяет отделить речь одного собеседника от всех остальных источников звука. Выделенная речь одного человека затем поступает на декодирование в систему распознавания речи.
На данный момент умение робота Asimo слушать сразу трех собеседников ограничивается малым объемом словаря и вычислительными мощностями систем локализации нескольких источников звука и распознавания слов. Тем не менее, японские разработчики оптимистично смотрят в будущее Asimo и заявляют, что уже сейчас робот превосходит человеческие возможности – мало кому удается слушать и понимать трех человек одновременно. Авторы системы HARK мечтают достигнуть уровня легендарного японского князя Сётоку (Prince Shotoku), который, по преданию, мог понимать 10 человек, говорящих одновременно.
Напомним, что в мае Asimo, рост которого составляет 130 сантиметров, а вес - 54 килограмма, выступил в роли дирижера симфонического оркестра.
Источник: soft.mail.ru
|