Abo
  • Services:

Intel bringt Computern das "Lippen lesen" bei

Open-Source-Lizenz für Eigenentwicklungen vorgestellt

Intel-Forscher haben im Rahmen einer Open-Source-Lizenz eine neue Software veröffentlicht. Sie ermöglicht nach Herstellerangaben Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise sollen in Zukunft PCs gesprochene Befehle besser verstehen können.

Artikel veröffentlicht am ,

Die Genauigkeit reiner Spracherkennungs-Algorithmen hat zwar mittlerweile Höhen erreicht, die noch vor wenigen Jahren undenkbar gewesen sind, aber lässt dennoch bei geräuschintensiven Umgebungen schnell nach. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio-Visual-Speech-Recognition-(AVSR-)Software, dass die Computer das Gesicht eines Sprechers erkennen und seinen Mundbewegungen folgen.

Stellenmarkt
  1. UnternehmerTUM GmbH, Garching bei München
  2. DRACHOLIN GmbH, Metzingen

Die Synchronisation von Videodaten mit Sprachidentifizierung soll dann eine deutlich genauere Spracherkennung möglich machen und Sprachanwendungen in geräuschintensiven Umgebungen verbessern. Die AVSR-Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.

"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."

OpenCV wurde für eine Innovationsbeschleunigung im Bereich Bilderkennung entwickelt, indem dabei Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitgestellt wurde. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.

Entwickler verwenden OpenCV Code nach Angaben von Intel in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C-Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren.

Auch IBM hat in dieser Richtung geforscht und zur CeBIT 2003 einen Prototypen eines lippenlesenden Headsets vorgestellt. Die Infrarot-Kamera helfe Spracherkennungs-Software, durch die Beobachtung von Lippen, Zähnen und evtl. auch der Zunge, die Sprach-Erkennungsrate zu erhöhen. Der IBM "Head Mounted Lip Reader" befindet sich derzeit im Protoypen-Stadium und soll in drei bis vier Monaten gemeinsam mit Partnern bzw. potenziellen Lizenznehmern aus der Industrie getestet und verbessert bzw. auf verschiedene Anwendungsgebiete angepasst werden. Es wird allerdings nach Angaben von IBM noch ein paar Jahre dauern, bis das Headset in kommerzieller Form verfügbar ist.



Anzeige
Spiele-Angebote
  1. 59,99€ mit Vorbesteller-Preisgarantie (Release 26.02.)
  2. (-80%) 11,99€
  3. 1,49€

KoTxE 29. Apr 2003

Ich weiss jetzt oute ich mich als Freak, aber da wart ich schon lange drauf. So als alter...

Goto Dengo 29. Apr 2003

wenn schon eine Gemeinsamkeit mit einem Film besteht, dann aber 2001! HAL lässt grüßen ;)

Geek 29. Apr 2003

Kommt auf die Lizenz an, man kann sie ja unter GPL stellen ... ;)

Cachicamo 29. Apr 2003

solange es nicht wie bei "demolition man" unter Strafe steht geht es noch.... Schlimm...

High-Tech-Overkill 29. Apr 2003

verdammt, darf ich dann vor meinem computer nicht mehr fluchen? und ihn als lahme...


Folgen Sie uns
       


Nike Adapt BB ausprobiert

Nikes neue Basketballschuhe Adapt BB schnüren sich automatisch zu, was in unserem Praxistest sehr gut funktioniert.

Nike Adapt BB ausprobiert Video aufrufen
Klimaschutz: Energieausweis für Nahrungsmittel
Klimaschutz
Energieausweis für Nahrungsmittel

Dänemark will ein Klimalabel für Lebensmittel. Es soll Auskunft über den CO2-Fußabdruck geben und dem Kunden Orientierung zu Ökofragen liefern.
Ein Bericht von Daniel Hautmann

  1. Standard Cognition Konkurrenz zu kassenlosen Amazon-Go-Supermärkten eröffnet
  2. Amazon-Go-Konkurrenz Microsoft arbeitet am kassenlosen Lebensmittel-Einkauf

Honor Magic 2 im Test: Die Smartphone-Revolution ist aufgeschoben
Honor Magic 2 im Test
Die Smartphone-Revolution ist aufgeschoben

Ein Smartphone, dessen vordere Seite vollständig vom Display ausgefüllt wird: Diesem Ideal kommt Honor mit dem Magic 2 schon ziemlich nahe. Nicht mit Magie, sondern mit Hilfe eines Slider-Mechanismus. Honor verschenkt beim Magic 2 aber viel Potenzial, wie der Test zeigt.
Ein Test von Tobias Czullay

  1. Honor Neues Magic 2 mit Slider und ohne Notch vorgestellt
  2. Huawei Neues Honor 8X kostet 250 Euro
  3. Honor 10 vs. Oneplus 6 Oberklasse ab 400 Euro

Digitaler Hausfriedensbruch: Bund warnt vor Verschärfung der Hackerparagrafen
Digitaler Hausfriedensbruch
Bund warnt vor Verschärfung der Hackerparagrafen

Ein Jahr Haft für das unbefugte Einschalten eines smarten Fernsehers? Unions-Politiker aus den Bundesländern überbieten sich gerade mit Forderungen, die Strafen für Hacker zu erhöhen und den Ermittlern mehr Befugnisse zu erteilen. Doch da will die Bundesregierung nicht mitmachen.
Von Friedhelm Greis

  1. Runc Sicherheitslücke ermöglicht Übernahme von Container-Host
  2. Security Metasploit 5.0 verbessert Datenbank und Automatisierungs-API
  3. Datenbank Fehler in SQLite ermöglichte Codeausführung

    •  /