Abo
  • Services:
Anzeige
Google forscht weiter auf dem Gebiet des Deep Learnings.
Google forscht weiter auf dem Gebiet des Deep Learnings. (Bild: Tobias Költzsch/Golem.de)

Forschung: Googles KI schlägt menschlichen Lippenleser

Google forscht weiter auf dem Gebiet des Deep Learnings.
Google forscht weiter auf dem Gebiet des Deep Learnings. (Bild: Tobias Költzsch/Golem.de)

Zusammen mit der Universität Oxford forschen Google-Wissenschaftler an einem Algorithmus, der automatisiertes Lippenlesen ermöglichen soll. Die bisherigen Ergebnisse sind sehr vielversprechend: Die Erkennungsrate der KI ist weitaus höher als die eines menschlichen Lippenlesers.

Forscher von Googles KI-Unternehmen Deepmind arbeiten zusammen mit Wissenschaftlern der Universität Oxford an einem Projekt, bei dem die künstliche Intelligenz Lippenlesen lernen soll. Dadurch soll es gehörlosen Personen einfacher möglich sein, Gespräche verfolgen zu können, ohne selbst von den Lippen ablesen können zu müssen.

Anzeige

KI hat weitaus höhere Erkennungsrate

Die ersten Ergebnisse des Projektes sind vielversprechend: Die KI erkennt 46,8 Prozent des ihr gezeigten Materials ohne Fehler, wohingegen ein professioneller menschlicher Lippenleser mit 12,4 Prozent eine wesentlich niedrigere Erfolgsquote hat, wie Newscientist schreibt und die Wissenschaftler in einem Paper erklären.

Die Forscher können auf einen großen Datensatz zurückgreifen: Dem System wurden zum Anlernen insgesamt 5.000 Stunden an Fernsehmaterial der BBC gezeigt, was 118.000 Sätzen entspricht. Diese wurden zwischen 2010 und 2015 gesendet. Anschließend haben die Wissenschaftler die KI mit Material getestet, das zwischen März und September 2016 gesendet wurde - sich also von den Trainingsvideos unterscheidet.

Das System erkannte dabei korrekt ganze Sätze. Viele der von der KI gemachten Fehler sollen zudem nur marginal sein, wie etwa ein fehlendes S am Ende eines Wortes. Das Videomaterial musste für das Training mit Hilfe des Computers korrekt synchronisiert werden, um Abweichungen zwischen Lippenbewegungen und Ton zu minimieren.

Auch Einsatzzwecke im Alltag denkbar

Neben dem Einsatz als Hilfe für Gehörlose sehen die Forscher noch weitere Szenarien, in denen ein automatisierter Lippenleser verwendet werden kann. Dazu zählt unter anderem Spracherkennung in lauten Umgebungen oder wortloses Diktieren in der Öffentlichkeit.


eye home zur Startseite
olleIcke 08. Dez 2016

Ja geil!! :D Ich habs auch gerade erst wieder gesehen! youtu.be/mvLgvychb18

pythoneer 24. Nov 2016

Danke!

Menplant 24. Nov 2016

Meine Aussage bezog sich darauf, dass die KI für den Tauben Lippen lesen soll. Die KI...

daarkside 24. Nov 2016

Aktuell ja, aber ob das grundsätzlich der Fall ist und bleibt, ist eine arg gewagte...

frostbitten king 24. Nov 2016

Ich glaube die genaue Intention von Google hier ist einfach Erforschung. Es ist bißchen...



Anzeige

Stellenmarkt
  1. KVM ServicePlus - Kunden- und Vertriebsmanagement GmbH, Halle
  2. über duerenhoff GmbH, Raum Essen
  3. Treif Maschinenbau GmbH, Oberlahr
  4. R&S Cybersecurity gateprotect GmbH, Hamburg


Anzeige
Blu-ray-Angebote
  1. (u. a. Game of Thrones, Big Bang Theory, The Vampire Diaries, Supernatural)
  2. (u. a. Hacksaw Ridge, Deadpool, Blade Runner, Kingsman, Arrival)

Folgen Sie uns
       


  1. Nach Einbruchsversuch

    Zehntausende Haushalte in Berlin ohne Telefon und Internet

  2. US-Gerichtsurteil

    Einbetten von Tweets kann Urheberrecht verletzen

  3. Anklage in USA erhoben

    So sollen russische Trollfabriken Trump unterstützt haben

  4. Gerichtsurteil

    Facebook drohen in Belgien bis zu 100 Millionen Euro Strafe

  5. Microsoft

    Windows on ARM ist inkompatibel zu 64-Bit-Programmen

  6. Fehler bei Zwei-Faktor-Authentifizierung

    Facebook will keine Benachrichtigungen per SMS schicken

  7. Europa-SPD

    Milliardenfonds zum Ausbau von Elektrotankstellen gefordert

  8. Carbon Copy Cloner

    APFS-Unterstützung wird wegen Datenverlustgefahr beschränkt

  9. Die Woche im Video

    Spezialeffekte und Spoiler

  10. Virtual RAN

    Telekom und Partner bauen Edge-Computing-Testnetz



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Freier Media-Player: VLC 3.0 eint alle Plattformen
Freier Media-Player
VLC 3.0 eint alle Plattformen

Ryzen 5 2400G und Ryzen 3 2200G im Test: Raven Ridge rockt
Ryzen 5 2400G und Ryzen 3 2200G im Test
Raven Ridge rockt
  1. Krypto-Mining AMDs Threadripper schürft effizient Monero
  2. AMD Zen+ und Zen 2 sind gegen Spectre gehärtet
  3. Pinnacle Ridge Asus aktualisiert Mainboard für Ryzen 2000

Dorothee Bär: Netzbetreiber werden über 100 MBit/s angeblich kaum los
Dorothee Bär
Netzbetreiber werden über 100 MBit/s angeblich kaum los
  1. FTTH/B Glasfaser wird in Deutschland besser nachgefragt
  2. Koalitionsvertrag fertig "Glasfaser möglichst direkt bis zum Haus"
  3. Glasfaser Telekom weitet FTTH-Pilotprojekt auf vier Orte aus

  1. Re: 2-Fache Redundanz = 2-Facher Preis --- Zahlst...

    plutoniumsulfat | 01:08

  2. Re: Kabel tauschen?

    tg-- | 01:04

  3. Re: Die Mil. Fonds sollte man eher in das marode...

    User_x | 01:04

  4. eher Kupferdiebe....

    bulli007 | 01:00

  5. Re: bankeinbuch...

    tg-- | 00:55


  1. 21:36

  2. 16:50

  3. 14:55

  4. 11:55

  5. 19:40

  6. 14:41

  7. 13:45

  8. 13:27


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel