• IT-Karriere:
  • Services:

Intel bringt Computern das "Lippen lesen" bei

Open-Source-Lizenz für Eigenentwicklungen vorgestellt

Intel-Forscher haben im Rahmen einer Open-Source-Lizenz eine neue Software veröffentlicht. Sie ermöglicht nach Herstellerangaben Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise sollen in Zukunft PCs gesprochene Befehle besser verstehen können.

Artikel veröffentlicht am ,

Die Genauigkeit reiner Spracherkennungs-Algorithmen hat zwar mittlerweile Höhen erreicht, die noch vor wenigen Jahren undenkbar gewesen sind, aber lässt dennoch bei geräuschintensiven Umgebungen schnell nach. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio-Visual-Speech-Recognition-(AVSR-)Software, dass die Computer das Gesicht eines Sprechers erkennen und seinen Mundbewegungen folgen.

Stellenmarkt
  1. Witzenmann GmbH, Pforzheim
  2. Landesamt für Steuern Niedersachsen, Hannover,Lage

Die Synchronisation von Videodaten mit Sprachidentifizierung soll dann eine deutlich genauere Spracherkennung möglich machen und Sprachanwendungen in geräuschintensiven Umgebungen verbessern. Die AVSR-Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

OpenCV wurde für eine Innovationsbeschleunigung im Bereich Bilderkennung entwickelt, indem dabei Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitgestellt wurde. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.

Entwickler verwenden OpenCV Code nach Angaben von Intel in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C-Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren.

Auch IBM hat in dieser Richtung geforscht und zur CeBIT 2003 einen Prototypen eines lippenlesenden Headsets vorgestellt. Die Infrarot-Kamera helfe Spracherkennungs-Software, durch die Beobachtung von Lippen, Zähnen und evtl. auch der Zunge, die Sprach-Erkennungsrate zu erhöhen. Der IBM "Head Mounted Lip Reader" befindet sich derzeit im Protoypen-Stadium und soll in drei bis vier Monaten gemeinsam mit Partnern bzw. potenziellen Lizenznehmern aus der Industrie getestet und verbessert bzw. auf verschiedene Anwendungsgebiete angepasst werden. Es wird allerdings nach Angaben von IBM noch ein paar Jahre dauern, bis das Headset in kommerzieller Form verfügbar ist.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. täglich neue Deals bei Alternate.de

KoTxE 29. Apr 2003

Ich weiss jetzt oute ich mich als Freak, aber da wart ich schon lange drauf. So als alter...

Goto Dengo 29. Apr 2003

wenn schon eine Gemeinsamkeit mit einem Film besteht, dann aber 2001! HAL lässt grüßen ;)

Geek 29. Apr 2003

Kommt auf die Lizenz an, man kann sie ja unter GPL stellen ... ;)

Cachicamo 29. Apr 2003

solange es nicht wie bei "demolition man" unter Strafe steht geht es noch.... Schlimm...

High-Tech-Overkill 29. Apr 2003

verdammt, darf ich dann vor meinem computer nicht mehr fluchen? und ihn als lahme...


Folgen Sie uns
       


Amazons FireTV Cube mit Sprachsteuerung - Test

Der Fire TV Cube ist mehr als ein Fire-TV-Modell. Er kann auf Zuruf gesteuert werden und wir zeigen im Video, wie gut das gelöst ist.

Amazons FireTV Cube mit Sprachsteuerung - Test Video aufrufen
Elektroschrott: Kauft keine kleinen Konsolen!
Elektroschrott
Kauft keine kleinen Konsolen!

Ich bin ein Fan von Retro. Und ein Fan von Games. Und ich habe den kleinen Plastikschachteln mit ihrer schlechten Umweltbilanz wirklich eine Chance gegeben. Aber es hilft alles nichts.
Ein IMHO von Martin Wolf

  1. IMHO Porsche prescht beim Preis übers Ziel hinaus
  2. Gaming Konsolenkrieg statt Spielestreaming

Jobs: Spielebranche sucht Entwickler (m/w/d)
Jobs
Spielebranche sucht Entwickler (m/w/d)

Die Hälfte aller Gamer ist weiblich. An der Entwicklung von Spielen sind aber nach wie vor deutlich weniger Frauen beteiligt.
Von Daniel Ziegener

  1. Medizinsoftware Forscher finden "rassistische Vorurteile" in Algorithmus
  2. Mordhau Toxische Spieler und Filter für Frauenhasser

Icann und ISOC: Der Ausverkauf des Internets
Icann und ISOC
Der Ausverkauf des Internets

Der Verkauf von .org wirkt wie ein Verschwörungskrimi voller seltsamer Zufälle, Korruption und zwielichtiger Gestalten. Hinzu kommen Intransparenz und Widersprüche.
Ein IMHO von Sebastian Grüner

  1. Breitbandausbau Bernie Sanders will Internet- und Kabelkonzerne zerschlagen
  2. Urheberrechtsverletzungen Europol nimmt 30.000 Domains offline
  3. Internet Europas IPv4-Adressen sind aufgeteilt

    •  /