Alexa, Google Assistant und Siri: Spezialgerät erlaubt lautlose Sprachsteuerung

Mit einer speziellen Lösung lassen sich Alexa, Google Assistant oder Siri auf Zuruf nutzen, wenn es nicht möglich ist, laut zu sprechen.

Artikel veröffentlicht am ,
Speechin erkennt anhand von Kinnbewegungen stumm gesprochene Wörter.
Speechin erkennt anhand von Kinnbewegungen stumm gesprochene Wörter. (Bild: Cornell University)

Wissenschaftler haben ein Versuchsgerät gebaut, mit dem sich digitale Assistenten wie Alexa, Google Assistant oder Siri auf Zuruf steuern lassen, ohne die Stimme der Person hören müssen. Digitale Assistenten sollen vor allem durch die Sprachsteuerung punkten. Aber es gibt Situationen, in denen eine Sprachsteuerung nicht sinnvoll möglich ist. Dafür wurde ein Spezialgerät entwickelt.

Dieses Spezialgerät ist auch für Menschen gedacht, die mit der Lauterzeugung Probleme haben. Sie sollen damit dennoch in der Lage sein, digitale Assistenten sprechend zu bedienen. Ein entsprechendes Versuchsgerät wurde von Assistenzprofessor Cheng Zhang und Doktorand Ruidong Zhang von der Cornell University entwickelt. Darüber hat Cornell Chronicle berichtet.

"Dieses Gerät hat das Potenzial, die Sprachmuster einer Person zu erlernen, selbst bei stillem Sprechen", sagte Zhang. Es nennt sich Speechin und verfolgt einen ähnlichen Ansatz wie Neckface. Neckface wurde von Cheng Zhang und seinen Sci-Fi-Lab-Teammitgliedern 2021 vorgestellt. Es verfolgt kontinuierlich die gesamte Mimik im Gesicht, indem es mit Infrarotkameras Bilder des Kinns und des Gesichts von unterhalb des Halses aufnimmt.

Spezialgerät wird um den Hals getragen

Auch Speechin nutzt eine IR-Kamera, die mit einem 3D-Drucker erstellt wurde. Das gesamte Konstrukt hängt in einem Gehäuse an einer Kette um den Hals und wird vor der Brust getragen. Dabei filmt die Kamera das Kinn der entsprechenden Person von unten. Durch diese Filmaufnahmen sollen sich Wörter vom Gerät erkennen lassen, auch wenn sie lautlos gesprochen werden. Die von Speechin erkannten Wörter werden dann an den betreffenden digitalen Assistenten weitergereicht.

Bei ersten Experimenten mit 20 Teilnehmern wurden Messungen vorgenommen, um die Ausgangsposition des Kinns zu bestimmen. Dann wurde das Gerät anhand von Differenzbildern darauf trainiert, einfache Befehle zu erkennen. Von den Teilnehmern sprachen zehn Englisch und zehn Mandarin-Chinesisch.

Zhang ließ die Personen 54 Befehle auf Englisch aussprechen, die aus Ziffern, interaktiven Befehlen, Sprachassistentenbefehlen, Interpunktionsbefehlen und Navigationsbefehlen bestanden. Anschließend machte er das Gleiche mit 44 einfachen Wörtern oder Sätzen in Mandarin. Speechin erkannte Befehle in Englisch und Mandarin mit einer durchschnittlichen Genauigkeit von 90,5 Prozent bzw. 91,6 Prozent.

Um die Grenzen dieses Verfahrens weiter zu testen, führten die Forscher eine weitere Studie mit zehn Teilnehmern durch, die alle eine speziell erstellte Liste von 72 einsilbigen Nichtwörtern mit Phonemen lautlos aussprachen. Die Nichtwörter waren Kombinationen aus 18 Konsonanten und vier Vokalen.

Schließlich rekrutierten die Forscher sechs Teilnehmer, die 10 Sätze in Mandarin und 10 in Englisch sprechen sollten und dabei umherliefen. Die Erfolgsquote war in dieser Studie geringer. Das wird damit erklärt, dass sich jeder Mensch beim Sprechen unterschiedlich bewegt. So gibt es mehr oder weniger Kopfbewegungen, was es für Speechin entsprechend schwieriger macht, das lautlos Gesprochene zu erkennen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
US Air Force  
KI-Drohne bringt in Gedankenexperiment Befehlshaber um

Die US Air Force und der verantwortliche Offizier stellen klar, dass es sich nur um ein Gedankenspiel handelt - und keinen echten Test.

US Air Force: KI-Drohne bringt in Gedankenexperiment Befehlshaber um
Artikel
  1. League of Legends: Riot Games legt sich mit Profispielern an
    League of Legends
    Riot Games legt sich mit Profispielern an

    In den USA bestreiken E-Sport-Profis League of Legends, Hersteller Riot Games sucht die Konfrontation. Es geht auch um viel Geld.

  2. Schleuderpreise auf Philips Hue bei Amazon
     
    Schleuderpreise auf Philips Hue bei Amazon

    Die eigenen vier Wände in ein Smart Home umwandeln? Mit der smarten Beleuchtung von Philips Hue ist es ganz einfach. Und zurzeit sehr günstig.
    Ausgewählte Angebote des E-Commerce-Teams

  3. SPSS vs. freie Statistiksoftware: Abschied von einem Klassiker
    SPSS vs. freie Statistiksoftware
    Abschied von einem Klassiker

    SPSS galt an den Hochschulen lange als Standard. Es gibt aber gute freie Software, der Umstieg lohnt sich - für Forscher, Dozenten und Studenten.
    Ein Ratgebertext von Thomas Langkamp

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Tiefstpreise: AMD Ryzen 9 7900X3D 534€, KFA2 RTX 3060 Ti 329,99€, Kingston Fury SSD 2TB (PS5-komp.) 129,91€ • Sony Days of Play: PS5-Spiele & Zubehör bis -70% • Roccat PC-Zubehör bis -50% • AVM Modems & Repeater bis -36% • Sony Deals Week [Werbung]
    •  /