Abo
  • IT-Karriere:

Deep Speech 0.2: Mozillas Spracherkennung wird kleiner und kann Echtzeit

Mit Deep Speech will Mozilla ein freies System zur Spracherkennung bereitstellen. Die aktuelle Version 0.2 ist nun deutlich kleiner und ermöglicht Echtzeitanwendungen für die Spracherkennung, wie das automatische Erstellen von Untertiteln.

Artikel veröffentlicht am ,
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele.
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele. (Bild: Mozilla/CC-BY 3.0)

Damit das Feld der Spracherkennung langfristig nicht wie bisher von Amazon, Google und Microsoft dominiert bleibt, hat sich Mozilla die ambitionierte Aufgabe gestellt, eine eigene und vor allem freie Spracherkennung zu entwickeln. Dieses als Deep Speech bezeichnete Projekt steht nun in Version 0.2 bereit, das eine Echtzeitanwendung ermöglicht.

Stellenmarkt
  1. Hays AG, Frankfurt am Main
  2. SSC-Services GmbH, Böblingen bei Stuttgart

Das eröffne eine Vielzahl verschiedener Einsatzmöglichkeiten für Deep Speech wie "Live-Untertitel für Radioprogramme, Twitch-Streams und Keynote-Präsentationen, Heimautomatisierung, sprachbasierte UIs" und Weiteres, wie der beteiligte Entwickler Reuben Morais in einem Blogeintrag schreibt.

Stream-Verarbeitung beim Inferencing

Das heißt, die Verarbeitung von Daten sowie die Anwendung des trainierten Modells - das Inferencing - ist nun nicht nur schneller als das Sprachsample lang ist, sondern das neue Modell kann das Inferencing auch schon während der Aufnahme der Sprachdaten beginnen. Bisher konnte das Modell nur mit einer abgeschlossenen Spracheingabe arbeiten.

Damit dies funktioniert, hat das Team das zugrundeliegende Modell so umgebaut, dass dies eben mit Streams zurechtkommt. Dazu werden nun die Audiodaten stückweise analysiert und das Ergebnis daraus zusammengesetzt. Technische Details zur Vorgehensweise liefert der Blogeintrag.

Zusätzlich zu der Geschwindigkeitssteigerung ist das neue trainierte Modell, das Mozilla zur Weiterverwendung unter einer freien Lizenz bereitstellt, nun nur noch rund 180 MByte groß - eine Reduktion um mehr als 60 Prozent. Ebenso sinkt die maximale Speicherbelastung von 12 GByte auf nur noch 264 MByte.



Anzeige
Spiele-Angebote
  1. 7,99€
  2. 4,99€
  3. 0,49€
  4. (-72%) 16,99€

pitsch 09. Okt 2018

es gibt wohl auch ein raspi projekt zu snips https://medium.com/@zibra_/how-to-build-a...

Kukulkan 20. Sep 2018

Mal im Ernst, es geht mir schon seit einiger Zeit auf den Keks dass man Spracherkennung...

ul mi 20. Sep 2018

hätte man das nicht "Mozilla Free Speech" nennen können? Vermeidet auch, dass sich...

tundracomp 20. Sep 2018

Bei DeepSpeech ist vom relevanten Code wahrscheinlich sowieso 90%+ von Googles TensorFlow...


Folgen Sie uns
       


Lenovo Smart Display im Test

Die ersten Smart Displays mit Google Assistant kommen von Lenovo. Die Geräte sind ordentlich, aber der Google Assistant ist nur unzureichend an den Touchscreen angepasst. Wir zeigen in unserem Testvideo die Probleme, die das bringt.

Lenovo Smart Display im Test Video aufrufen
Black Mirror Staffel 5: Der Gesellschaft den Spiegel vorhalten
Black Mirror Staffel 5
Der Gesellschaft den Spiegel vorhalten

Black Mirror zeigt in der neuen Staffel noch alltagsnäher als bisher, wie heutige Technologien das Leben in der Zukunft katastrophal auf den Kopf stellen könnten. Dabei greift die Serie auch aktuelle Diskussionen auf und zeigt mitunter, was bereits im heutigen Alltag schiefläuft - ein Meisterwerk! Achtung, Spoiler!
Eine Rezension von Tobias Költzsch

  1. Streaming Netflix testet an Instagram erinnernden News-Feed
  2. Start von Disney+ Netflix wird nicht dauerhaft alle Disney-Inhalte verlieren
  3. Videostreaming Netflix will Zuschauerzahlen nicht länger geheim halten

Digitaler Knoten 4.0: Auto und Ampel im Austausch
Digitaler Knoten 4.0
Auto und Ampel im Austausch

Auf der Autobahn klappt das autonome Fahren schon recht gut. In der Stadt brauchen die Autos jedoch Unterstützung. In Braunschweig testet das DLR die Vernetzung von Autos und Infrastruktur, damit die autonom fahrenden Autos im fließenden Verkehr links abbiegen können.
Ein Bericht von Werner Pluta

  1. LTE-V2X vs. WLAN 802.11p Wer hat Recht im Streit ums Auto-WLAN?
  2. Vernetztes Fahren Lobbyschlacht um WLAN und 5G in Europa
  3. Gefahrenwarnungen EU setzt bei vernetztem Fahren weiter auf WLAN

Webbrowser: Das Tracking ist tot, es lebe das Tracking
Webbrowser
Das Tracking ist tot, es lebe das Tracking

Die großen Browserhersteller Apple, Google und Mozilla versprechen ihren Nutzern Techniken, die das Tracking im Netz erschweren sollen. Doch das stärkt Werbemonopole im Netz und die Methoden verhindern das Tracking nicht.
Eine Analyse von Sebastian Grüner

  1. Europawahlen Bundeszentrale will Wahl-O-Mat nachbessern
  2. Werbenetzwerke Weitere DSGVO-Untersuchung gegen Google gestartet
  3. WLAN-Tracking Ab Juli 2019 will Londons U-Bahn Smartphones verfolgen

    •  /