Forschung: Googles KI schlägt menschlichen Lippenleser

Zusammen mit der Universität Oxford forschen Google-Wissenschaftler an einem Algorithmus, der automatisiertes Lippenlesen ermöglichen soll. Die bisherigen Ergebnisse sind sehr vielversprechend: Die Erkennungsrate der KI ist weitaus höher als die eines menschlichen Lippenlesers.

Artikel veröffentlicht am ,
Google forscht weiter auf dem Gebiet des Deep Learnings.
Google forscht weiter auf dem Gebiet des Deep Learnings. (Bild: Tobias Költzsch/Golem.de)

Forscher von Googles KI-Unternehmen Deepmind arbeiten zusammen mit Wissenschaftlern der Universität Oxford an einem Projekt, bei dem die künstliche Intelligenz Lippenlesen lernen soll. Dadurch soll es gehörlosen Personen einfacher möglich sein, Gespräche verfolgen zu können, ohne selbst von den Lippen ablesen können zu müssen.

KI hat weitaus höhere Erkennungsrate

Stellenmarkt
  1. Data Warehouse Entwickler/ETL-Entwickler (m/w/d)
    SBK Siemens-Betriebskrankenkasse, München
  2. Trainee Data Science / Analytics (m/w/d)
    BARMER, Wuppertal
Detailsuche

Die ersten Ergebnisse des Projektes sind vielversprechend: Die KI erkennt 46,8 Prozent des ihr gezeigten Materials ohne Fehler, wohingegen ein professioneller menschlicher Lippenleser mit 12,4 Prozent eine wesentlich niedrigere Erfolgsquote hat, wie Newscientist schreibt und die Wissenschaftler in einem Paper erklären.

Die Forscher können auf einen großen Datensatz zurückgreifen: Dem System wurden zum Anlernen insgesamt 5.000 Stunden an Fernsehmaterial der BBC gezeigt, was 118.000 Sätzen entspricht. Diese wurden zwischen 2010 und 2015 gesendet. Anschließend haben die Wissenschaftler die KI mit Material getestet, das zwischen März und September 2016 gesendet wurde - sich also von den Trainingsvideos unterscheidet.

Das System erkannte dabei korrekt ganze Sätze. Viele der von der KI gemachten Fehler sollen zudem nur marginal sein, wie etwa ein fehlendes S am Ende eines Wortes. Das Videomaterial musste für das Training mit Hilfe des Computers korrekt synchronisiert werden, um Abweichungen zwischen Lippenbewegungen und Ton zu minimieren.

Auch Einsatzzwecke im Alltag denkbar

Neben dem Einsatz als Hilfe für Gehörlose sehen die Forscher noch weitere Szenarien, in denen ein automatisierter Lippenleser verwendet werden kann. Dazu zählt unter anderem Spracherkennung in lauten Umgebungen oder wortloses Diktieren in der Öffentlichkeit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Neues Betriebssystem von Microsoft
Wir probieren Windows 11 aus

Windows 11 ist bereits im Umlauf. Wir haben die Vorabversion ausprobiert und ein schickes OS durchstöbert. Im Kern ist es aber Windows 10.
Ein Hands-on von Oliver Nickel

Neues Betriebssystem von Microsoft: Wir probieren Windows 11 aus
Artikel
  1. Glasfaser: Telekom beginnt FTTH-Vermarktung für 154.000 Haushalte
    Glasfaser
    Telekom beginnt FTTH-Vermarktung für 154.000 Haushalte

    Die Telekom beginnt, FTTH-Zugänge in hoher Anzahl zu produzieren.

  2. Akkutechnologie: Solid Power ist näher an brauchbaren Akkus als Quantumscape
    Akkutechnologie
    Solid Power ist näher an brauchbaren Akkus als Quantumscape

    Lückenhafte technische Daten, schräge Kostenvergleiche, verschwiegene Nachteile - aber Solid Power ist immer noch ehrlicher als Quantumscape.
    Eine Analyse von Frank Wunderlich-Pfeiffer

  3. Impfzentren: Online-Portal für digitalen Impfnachweis gestartet
    Impfzentren
    Online-Portal für digitalen Impfnachweis gestartet

    In Hamburg kann man sich selbst einen digitalen Impfnachweis ausstellen. Bei den Apotheken gab es am Dienstag offenbar stundenlange Ausfälle.

olleIcke 08. Dez 2016

Ja geil!! :D Ich habs auch gerade erst wieder gesehen! youtu.be/mvLgvychb18

pythoneer 24. Nov 2016

Danke!

Menplant 24. Nov 2016

Meine Aussage bezog sich darauf, dass die KI für den Tauben Lippen lesen soll. Die KI...

daarkside 24. Nov 2016

Aktuell ja, aber ob das grundsätzlich der Fall ist und bleibt, ist eine arg gewagte...

frostbitten king 24. Nov 2016

Ich glaube die genaue Intention von Google hier ist einfach Erforschung. Es ist bißchen...


Folgen Sie uns
       


Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Saturn Super Sale (u. a. Samsung 65" QLED (2021) 1.294€) • MSI MAG274R2 27" FHD 144Hz 269€ • Dualsense Midnight Black + Ratchet & Clank Rift Apart 99,99€ • Apple iPads (u. a. iPad Pro 12,9" 256GB 909€) • Razer Naga Pro 119,99€ • Alternate (u. a. NZXT Kraken WaKü 109,90€) [Werbung]
    •  /