Abo
  • Services:

Intel bringt Computern das "Lippen lesen" bei

Open-Source-Lizenz für Eigenentwicklungen vorgestellt

Intel-Forscher haben im Rahmen einer Open-Source-Lizenz eine neue Software veröffentlicht. Sie ermöglicht nach Herstellerangaben Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise sollen in Zukunft PCs gesprochene Befehle besser verstehen können.

Artikel veröffentlicht am ,

Die Genauigkeit reiner Spracherkennungs-Algorithmen hat zwar mittlerweile Höhen erreicht, die noch vor wenigen Jahren undenkbar gewesen sind, aber lässt dennoch bei geräuschintensiven Umgebungen schnell nach. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio-Visual-Speech-Recognition-(AVSR-)Software, dass die Computer das Gesicht eines Sprechers erkennen und seinen Mundbewegungen folgen.

Stellenmarkt
  1. Versandhaus Walz GmbH, Bad Waldsee
  2. Vector Informatik GmbH, Stuttgart

Die Synchronisation von Videodaten mit Sprachidentifizierung soll dann eine deutlich genauere Spracherkennung möglich machen und Sprachanwendungen in geräuschintensiven Umgebungen verbessern. Die AVSR-Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

OpenCV wurde für eine Innovationsbeschleunigung im Bereich Bilderkennung entwickelt, indem dabei Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitgestellt wurde. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.

Entwickler verwenden OpenCV Code nach Angaben von Intel in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C-Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren.

Auch IBM hat in dieser Richtung geforscht und zur CeBIT 2003 einen Prototypen eines lippenlesenden Headsets vorgestellt. Die Infrarot-Kamera helfe Spracherkennungs-Software, durch die Beobachtung von Lippen, Zähnen und evtl. auch der Zunge, die Sprach-Erkennungsrate zu erhöhen. Der IBM "Head Mounted Lip Reader" befindet sich derzeit im Protoypen-Stadium und soll in drei bis vier Monaten gemeinsam mit Partnern bzw. potenziellen Lizenznehmern aus der Industrie getestet und verbessert bzw. auf verschiedene Anwendungsgebiete angepasst werden. Es wird allerdings nach Angaben von IBM noch ein paar Jahre dauern, bis das Headset in kommerzieller Form verfügbar ist.



Anzeige
Top-Angebote
  1. 1.099€
  2. 184,90€ + 5,99€ Versand (Vergleichspreis ca. 233€)
  3. 35€
  4. 99€

KoTxE 29. Apr 2003

Ich weiss jetzt oute ich mich als Freak, aber da wart ich schon lange drauf. So als alter...

Goto Dengo 29. Apr 2003

wenn schon eine Gemeinsamkeit mit einem Film besteht, dann aber 2001! HAL lässt grüßen ;)

Geek 29. Apr 2003

Kommt auf die Lizenz an, man kann sie ja unter GPL stellen ... ;)

Cachicamo 29. Apr 2003

solange es nicht wie bei "demolition man" unter Strafe steht geht es noch.... Schlimm...

High-Tech-Overkill 29. Apr 2003

verdammt, darf ich dann vor meinem computer nicht mehr fluchen? und ihn als lahme...


Folgen Sie uns
       


iPad 2018 - Test

Das neue iPad hat vertraute Funktionen, die es teilweise zu diesem Preis aber noch nicht gegeben hat. Wir haben uns Apples neues Tablet im Test angeschaut.

iPad 2018 - Test Video aufrufen
Ryzen 5 2600X im Test: AMDs Desktop-Allrounder
Ryzen 5 2600X im Test
AMDs Desktop-Allrounder

Der Ryzen 5 2600X ist eine der besten sechskernigen CPUs am Markt. Für gut 200 Euro liefert er die gleiche Leistung wie der Core i5-8600K. Der AMD-Chip hat klare Vorteile bei Anwendungen, das Intel-Modell in Spielen.
Ein Test von Marc Sauter

  1. Golem.de-Livestream Wie gut ist AMDs Ryzen 2000?
  2. RAM-Overclocking getestet Auch Ryzen 2000 profitiert von schnellem Speicher
  3. Ryzen 2400GE/2200GE AMD veröffentlicht sparsame 35-Watt-APUs

Indiegames-Rundschau: Kampfkrieger und Abenteuer in 1001 Nacht
Indiegames-Rundschau
Kampfkrieger und Abenteuer in 1001 Nacht

Battletech schickt Spieler in toll inszenierte Strategieschlachten, eine königliche Fantasywelt und Abenteuer im Orient: Unsere Rundschau stellt diesmal besonders spannende Indiegames vor.
Von Rainer Sigl

  1. Indiegames-Rundschau Mutige Mäuse und tapfere Trabbis
  2. Indiegames-Rundschau Zwischen Fake News und Mountainbiken
  3. Indiegames-Rundschau Tiefseemonster, Cyberpunks und ein Kelte

Projektoren im Vergleichstest: 4K-Beamer für unter 2K Euro
Projektoren im Vergleichstest
4K-Beamer für unter 2K Euro

Bildschirme mit UHD- und 4K-Auflösung sind in den vergangenen Jahren immer preiswerter geworden. Seit 2017 gibt es den Trend zu hoher Pixelzahl und niedrigem Preis auch bei Projektoren. Wir haben vier von ihnen getestet und stellen am Ende die Sinnfrage.
Ein Test von Martin Wolf

  1. Sony MP-CD1 Taschenbeamer mit Akku und USB-C-Stromversorgung
  2. Mirraviz Multiview Splitscreen-Games spielen ohne die Möglichkeit, zu schummeln
  3. Sony LSPX-A1 30.000-Dollar-Beamer strahlt 80 Zoll aus 0 cm Entfernung

    •  /