Robotik: Hearbo, der hörende Roboter

Der von Honda entwickelte humanoide Roboter Hearbo versteht genau, was ein Mensch ihm sagt: Er verfügt über ein besonderes System zur akustischen Wahrnehmung, das ihm ermöglicht, vier Geräuschquellen zu unterscheiden und zu verarbeiten.

Artikel veröffentlicht am ,
Stimme, Geräusch oder Musik - Hearbo kann unterscheiden.
Stimme, Geräusch oder Musik - Hearbo kann unterscheiden. (Bild: HRI-JP/Screenshot: Golem.de)

Hearbo (von: Hearing Robot) ist ein von Honda entwickelter Roboter, der auf akustische Wahrnehmung spezialisiert ist. Entwickelt wurde er am Honda Research Institute Japan (HRI-JP).

Stellenmarkt
  1. Manager (m/w/d) IT Enterprise Architecture
    Porsche Financial Services GmbH, Bietigheim-Bissingen
  2. Softwareentwickler*in C++ / Netzwerkarchitekturen (w/m/d)
    Hensoldt, Aalen
Detailsuche

Roboter sollen künftig Menschen im Haushalt unterstützen - als eine Art Maschinen-Butler: Der Mensch trägt ihm eine Aufgabe auf, und der Roboter erledigt sie. Für Letzteres ist Ersteres grundlegend: Der Roboter muss verstehen, was er tun soll - und zwar nicht nur vom Sinn her, sondern auch akustisch. Dazu haben die Forscher um Kazuhiro Nakadai das Open-Source-Wahrnehmungssystem Hark (Abkürzung für: HRI-JP Audition for Robots with Kyoto University) entwickelt. Es ermöglicht Hearbo, Sprachkommandos auch in einer Umgebung mit Hintergrundgeräuschen zu verstehen.

Geräusche unterdrücken

Herkömmliche Spracherkennungsverfahren beruhen meist auf einer Methode namens Beamforming: Das System lokalisiert den Sprechenden, unterdrückt Hintergrundlärm und wendet dann Spracherkennung an.

Das Hark-System arbeitet etwas anders: Der Roboter lokalisiert mit seinen acht Mikrofonen alle Geräuschquellen im Raum, also den Sprecher sowie die Quellen von Hintergrundgeräuschen wie etwa den Fernseher. Dann werden die Geräuschquellen getrennt und verarbeitet. Gleichzeitig läuft ständig eine Ego-Noise Suppression. Das bedeutet, der Roboter filtert die Geräusche, die seine 17 Motoren erzeugen, aus, damit sie die akustische Wahrnehmung nicht stören.

Krach oder Information

Golem Karrierewelt
  1. CEH Certified Ethical Hacker v11: virtueller Fünf-Tage-Workshop
    05.-09.09.2022, Virtuell
  2. Green IT: Praxisratgeber zur nachhaltigen IT-Nutzung (virtueller Ein-Tages-Workshop)
    19.10.2022, virtuell
Weitere IT-Trainings

Hark kann eine Geräuschquelle auf ein Grad genau lokalisieren. Es erkennt und verarbeitet vier verschiedene Geräuschquellen und Stimmen. Die Idee des Ansatzes sei, dass Geräusche auch wichtige Informationen enthalten könnten und deshalb nicht einfach unterdrückt werden sollten, berichtet das US-Wissenschaftsmagazin IEEE Spectrum. Das Schreien eines Säuglings sei zwar eine Störung beim Zuhören, aber auch eine Nachricht, die beachtet werden müsse.

Das System kann Geräuschquellen auch qualitativ einordnen. Die Forscher haben Hearbo gelehrt, Musik zu erkennen, indem sie ihm viele Musikstücke vorgespielt haben. Irgendwann war der Roboter in der Lage, einen Song, den er nie zuvor gehört hatte, als Musik zu klassifizieren. Das bedeutet, Hearbo ist auch in der Lage, eine Stimme, die ihm Anweisungen erteilt, von der Stimme eines Sängers zu unterscheiden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Geplante Obsoleszenz
Epson schaltet Drucker wegen voller Schwämme ab

Die Drucker funktionieren noch tadellos, ein angebliches Risiko durch volle Tintenschwämme ist für Epson aber Grund, die Geräte zu deaktivieren.

Geplante Obsoleszenz: Epson schaltet Drucker wegen voller Schwämme ab
Artikel
  1. Klimawandel: SSDs sind klimaschädlicher als mechanische Festplatten
    Klimawandel
    SSDs sind klimaschädlicher als mechanische Festplatten

    Während ihrer Lebensdauer verursacht eine SSD fast doppelt so hohe CO2-Emissionen wie eine mechanische HDD.

  2. Android 13: Samsung startet Beta von One UI 5 in Deutschland
    Android 13
    Samsung startet Beta von One UI 5 in Deutschland

    Samsungs Anpassung von Android 13 für seine Geräte ist zunächst für die Galaxy-S22-Reihe verfügbar.

  3. Microsoft Loop: Riesenkonzept mit Riesenchance auf Riesenchaos
    Microsoft Loop
    Riesenkonzept mit Riesenchance auf Riesenchaos

    Sehr unauffällig rollt Microsoft seine neue Technik Loop für die Onlinezusammenarbeit aus. Admins sollten sie jetzt schon auf dem Schirm haben, denn sie ist vielversprechend, erfordert aber viel Eindenken. Wir erklären sie im Detail.
    Von Mathias Küfner

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (Gainward RTX 3070 559€, ASRock RX 6800 639€) • WD Black SSD 2TB m. Kühlkörper (PS5) 219,90€ • Gigabyte Deals • Alternate (DeepCool Wakü 114,90€, PC-Netzteil 79,90€) • be quiet! Deals • SSV bei Saturn (u. a. WD_BLACK SN850 1TB 119€) Gamesplant Summer Sale [Werbung]
    •  /