Intel bringt Computern das "Lippen lesen" bei

Open-Source-Lizenz für Eigenentwicklungen vorgestellt

Intel-Forscher haben im Rahmen einer Open-Source-Lizenz eine neue Software veröffentlicht. Sie ermöglicht nach Herstellerangaben Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise sollen in Zukunft PCs gesprochene Befehle besser verstehen können.

Artikel veröffentlicht am ,

Die Genauigkeit reiner Spracherkennungs-Algorithmen hat zwar mittlerweile Höhen erreicht, die noch vor wenigen Jahren undenkbar gewesen sind, aber lässt dennoch bei geräuschintensiven Umgebungen schnell nach. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio-Visual-Speech-Recognition-(AVSR-)Software, dass die Computer das Gesicht eines Sprechers erkennen und seinen Mundbewegungen folgen.

Stellenmarkt
  1. IT-Security-Administrator*in (m/w/d)
    Landkreis Tübingen, Tübingen
  2. (Senior) MLOps Engineer (Cloud) (m/f/d)
    Lidl Digital, Berlin, Neckarsulm
Detailsuche

Die Synchronisation von Videodaten mit Sprachidentifizierung soll dann eine deutlich genauere Spracherkennung möglich machen und Sprachanwendungen in geräuschintensiven Umgebungen verbessern. Die AVSR-Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

OpenCV wurde für eine Innovationsbeschleunigung im Bereich Bilderkennung entwickelt, indem dabei Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitgestellt wurde. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.

Golem Karrierewelt
  1. Jira für Anwender: virtueller Ein-Tages-Workshop
    30.06.2022, virtuell
  2. Einführung in Unity: virtueller Ein-Tages-Workshop
    12.08.2022, Virtuell
Weitere IT-Trainings

Entwickler verwenden OpenCV Code nach Angaben von Intel in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C-Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren.

Auch IBM hat in dieser Richtung geforscht und zur CeBIT 2003 einen Prototypen eines lippenlesenden Headsets vorgestellt. Die Infrarot-Kamera helfe Spracherkennungs-Software, durch die Beobachtung von Lippen, Zähnen und evtl. auch der Zunge, die Sprach-Erkennungsrate zu erhöhen. Der IBM "Head Mounted Lip Reader" befindet sich derzeit im Protoypen-Stadium und soll in drei bis vier Monaten gemeinsam mit Partnern bzw. potenziellen Lizenznehmern aus der Industrie getestet und verbessert bzw. auf verschiedene Anwendungsgebiete angepasst werden. Es wird allerdings nach Angaben von IBM noch ein paar Jahre dauern, bis das Headset in kommerzieller Form verfügbar ist.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


KoTxE 29. Apr 2003

Ich weiss jetzt oute ich mich als Freak, aber da wart ich schon lange drauf. So als alter...

Goto Dengo 29. Apr 2003

wenn schon eine Gemeinsamkeit mit einem Film besteht, dann aber 2001! HAL lässt grüßen ;)

Geek 29. Apr 2003

Kommt auf die Lizenz an, man kann sie ja unter GPL stellen ... ;)

Cachicamo 29. Apr 2003

solange es nicht wie bei "demolition man" unter Strafe steht geht es noch.... Schlimm...



Aktuell auf der Startseite von Golem.de
Elektroauto
ID.3-Konkurrent MG4 kommt Ende 2022 nach Europa

MG Motor bringt sein kompaktes Elektroauto MG4 Electric nach Europa. Im vierten Quartal 2022 erscheint das Fahrzeug.

Elektroauto: ID.3-Konkurrent MG4 kommt Ende 2022 nach Europa
Artikel
  1. Playstation Plus im Test: Die Ära der Spielabos ist endgültig angebrochen!
    Playstation Plus im Test
    Die Ära der Spielabos ist endgültig angebrochen!

    Mit PS Plus gibt es nun Spieleabos für (fast) alle Plattformen. Eines ist beim insgesamt guten, aber konfusen Angebot von Sony aber noch offen.
    Von Peter Steinlechner

  2. Return to Monkey Island: Gameplay-Trailer zeigt neuen Guybrush Threepwood
    Return to Monkey Island
    Gameplay-Trailer zeigt neuen Guybrush Threepwood

    Das dürfte nicht nur für Begeisterung sorgen: Erstmals ist Gameplay aus dem nächsten Monkey Island zu sehen - inklusive der Hauptfigur.

  3. Elektroautos: Tesla hat offenbar zu wenig Platz für Homeoffice-Rückkehrer
    Elektroautos
    Tesla hat offenbar zu wenig Platz für Homeoffice-Rückkehrer

    Tesla holt seine Angestellten mit Drohungen aus dem Homeoffice zurück - hat im Büro aber gar nicht genügend Platz für alle.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Top-TVs bis 57% Rabatt • PS5 bestellbar • MindStar (Palit RTX 3080 Ti 1.099€, G.Skill DDR5-5600 32GB 189€) • Lenovo 34" UWQHD 144 Hz günstig wie nie: 339,94€ • Corsair Wakü 236,89€ • Top-Gaming-PC mit AMD Ryzen 7 RTX 3070 Ti 1.700€ • Alternate (Team Group SSD 1TB 119,90€)[Werbung]
    •  /