• IT-Karriere:
  • Services:

Intel bringt Computern das "Lippen lesen" bei

Open-Source-Lizenz für Eigenentwicklungen vorgestellt

Intel-Forscher haben im Rahmen einer Open-Source-Lizenz eine neue Software veröffentlicht. Sie ermöglicht nach Herstellerangaben Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise sollen in Zukunft PCs gesprochene Befehle besser verstehen können.

Artikel veröffentlicht am ,

Die Genauigkeit reiner Spracherkennungs-Algorithmen hat zwar mittlerweile Höhen erreicht, die noch vor wenigen Jahren undenkbar gewesen sind, aber lässt dennoch bei geräuschintensiven Umgebungen schnell nach. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio-Visual-Speech-Recognition-(AVSR-)Software, dass die Computer das Gesicht eines Sprechers erkennen und seinen Mundbewegungen folgen.

Stellenmarkt
  1. LORENZ Life Sciences Group, Frankfurt am Main
  2. Deutsche Rentenversicherung Rheinland, Düsseldorf

Die Synchronisation von Videodaten mit Sprachidentifizierung soll dann eine deutlich genauere Spracherkennung möglich machen und Sprachanwendungen in geräuschintensiven Umgebungen verbessern. Die AVSR-Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

OpenCV wurde für eine Innovationsbeschleunigung im Bereich Bilderkennung entwickelt, indem dabei Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitgestellt wurde. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.

Entwickler verwenden OpenCV Code nach Angaben von Intel in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C-Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren.

Auch IBM hat in dieser Richtung geforscht und zur CeBIT 2003 einen Prototypen eines lippenlesenden Headsets vorgestellt. Die Infrarot-Kamera helfe Spracherkennungs-Software, durch die Beobachtung von Lippen, Zähnen und evtl. auch der Zunge, die Sprach-Erkennungsrate zu erhöhen. Der IBM "Head Mounted Lip Reader" befindet sich derzeit im Protoypen-Stadium und soll in drei bis vier Monaten gemeinsam mit Partnern bzw. potenziellen Lizenznehmern aus der Industrie getestet und verbessert bzw. auf verschiedene Anwendungsgebiete angepasst werden. Es wird allerdings nach Angaben von IBM noch ein paar Jahre dauern, bis das Headset in kommerzieller Form verfügbar ist.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (u. a. Seagate BarraCuda Compute 8 TB für 158,90€ + 6,79€ Versand und Edifier Studio 1280T...
  2. 60,99€ (Vergleichspreis 77,81€)
  3. (u. a. MX500 1 TB für 93,10€ mit Gutschein: NBBCRUCIALDAYS)
  4. (u. a. ASUS TUF Gaming VG32VQ1B WQHD/165 Hz für 330,45€ statt 389€ im Vergleich und Tastaturen...

KoTxE 29. Apr 2003

Ich weiss jetzt oute ich mich als Freak, aber da wart ich schon lange drauf. So als alter...

Goto Dengo 29. Apr 2003

wenn schon eine Gemeinsamkeit mit einem Film besteht, dann aber 2001! HAL lässt grüßen ;)

Geek 29. Apr 2003

Kommt auf die Lizenz an, man kann sie ja unter GPL stellen ... ;)

Cachicamo 29. Apr 2003

solange es nicht wie bei "demolition man" unter Strafe steht geht es noch.... Schlimm...

High-Tech-Overkill 29. Apr 2003

verdammt, darf ich dann vor meinem computer nicht mehr fluchen? und ihn als lahme...


Folgen Sie uns
       


Zhaxoin ZX-U6780U - Fazit

Wir testen den ZX-U6780U von Zhaxoin, einen achtkernigen x86-Prozessor aus China, der im 16-nm-Verfahren gefertigt wird. Die x86-Lizenz stammt von Centaur, einer Tochter von Via Technologies.

Zhaxoin ZX-U6780U - Fazit Video aufrufen
Indiegames-Rundschau: Stadtbaukasten trifft Tentakelmonster
Indiegames-Rundschau
Stadtbaukasten trifft Tentakelmonster

Traumstädte bauen in Townscaper, Menschen fressen in Carrion und Bilderbuchgrusel in Creaks: Die neuen Indiegames bieten viel Abwechslung.
Von Rainer Sigl

  1. Indiegames-Rundschau Licht aus, Horror an
  2. Indiegames-Neuheiten Der Saturnmond als galaktische Baustelle
  3. Indiegames-Rundschau Dunkle Seelen im Heavy-Metal-Rausch

Campus Networks: Wenn das 5G-Netz nicht jeden reinlässt
Campus Networks
Wenn das 5G-Netz nicht jeden reinlässt

Über private 4G- und 5G-Netze gibt es meist nur Buzzwords. Wir wollten von einer Telekom-Expertin wissen, was die Campusnetze wirklich können und was noch nicht.
Von Achim Sawall

  1. Funkstrahlung Bürgermeister in Oberbayern greifen 5G der Telekom an
  2. IRT Öffentlich-rechtlicher Rundfunk schließt Forschungszentrum
  3. Deutsche Telekom 5G im UMTS-Spektrum für die Hälfte der Bevölkerung

Programmiersprache Go: Schlanke Syntax, schneller Compiler
Programmiersprache Go
Schlanke Syntax, schneller Compiler

Die objektorientierte Programmiersprache Go eignet sich vor allem zum Schreiben von Netzwerk- und Cloud-Diensten.
Von Tim Schürmann


      •  /