Forschung: Googles KI schlägt menschlichen Lippenleser
Forscher von Googles KI-Unternehmen Deepmind arbeiten zusammen mit Wissenschaftlern der Universität Oxford an einem Projekt, bei dem die künstliche Intelligenz Lippenlesen lernen soll. Dadurch soll es gehörlosen Personen einfacher möglich sein, Gespräche verfolgen zu können, ohne selbst von den Lippen ablesen können zu müssen.
KI hat weitaus höhere Erkennungsrate
Die ersten Ergebnisse des Projektes sind vielversprechend: Die KI erkennt 46,8 Prozent des ihr gezeigten Materials ohne Fehler, wohingegen ein professioneller menschlicher Lippenleser mit 12,4 Prozent eine wesentlich niedrigere Erfolgsquote hat, wie Newscientist(öffnet im neuen Fenster) schreibt und die Wissenschaftler in einem Paper(öffnet im neuen Fenster) erklären.
Die Forscher können auf einen großen Datensatz zurückgreifen: Dem System wurden zum Anlernen insgesamt 5.000 Stunden an Fernsehmaterial der BBC gezeigt, was 118.000 Sätzen entspricht. Diese wurden zwischen 2010 und 2015 gesendet. Anschließend haben die Wissenschaftler die KI mit Material getestet, das zwischen März und September 2016 gesendet wurde – sich also von den Trainingsvideos unterscheidet.
Das System erkannte dabei korrekt ganze Sätze. Viele der von der KI gemachten Fehler sollen zudem nur marginal sein, wie etwa ein fehlendes S am Ende eines Wortes. Das Videomaterial musste für das Training mit Hilfe des Computers korrekt synchronisiert werden, um Abweichungen zwischen Lippenbewegungen und Ton zu minimieren.
Auch Einsatzzwecke im Alltag denkbar
Neben dem Einsatz als Hilfe für Gehörlose sehen die Forscher noch weitere Szenarien, in denen ein automatisierter Lippenleser verwendet werden kann. Dazu zählt unter anderem Spracherkennung in lauten Umgebungen oder wortloses Diktieren in der Öffentlichkeit.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.