Abo
  • Services:

Deep Speech 0.2: Mozillas Spracherkennung wird kleiner und kann Echtzeit

Mit Deep Speech will Mozilla ein freies System zur Spracherkennung bereitstellen. Die aktuelle Version 0.2 ist nun deutlich kleiner und ermöglicht Echtzeitanwendungen für die Spracherkennung, wie das automatische Erstellen von Untertiteln.

Artikel veröffentlicht am ,
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele.
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele. (Bild: Mozilla/CC-BY 3.0)

Damit das Feld der Spracherkennung langfristig nicht wie bisher von Amazon, Google und Microsoft dominiert bleibt, hat sich Mozilla die ambitionierte Aufgabe gestellt, eine eigene und vor allem freie Spracherkennung zu entwickeln. Dieses als Deep Speech bezeichnete Projekt steht nun in Version 0.2 bereit, das eine Echtzeitanwendung ermöglicht.

Stellenmarkt
  1. BIM Berliner Immobilienmanagement GmbH, Berlin
  2. OHB System AG, Bremen, Oberpfaffenhofen

Das eröffne eine Vielzahl verschiedener Einsatzmöglichkeiten für Deep Speech wie "Live-Untertitel für Radioprogramme, Twitch-Streams und Keynote-Präsentationen, Heimautomatisierung, sprachbasierte UIs" und Weiteres, wie der beteiligte Entwickler Reuben Morais in einem Blogeintrag schreibt.

Stream-Verarbeitung beim Inferencing

Das heißt, die Verarbeitung von Daten sowie die Anwendung des trainierten Modells - das Inferencing - ist nun nicht nur schneller als das Sprachsample lang ist, sondern das neue Modell kann das Inferencing auch schon während der Aufnahme der Sprachdaten beginnen. Bisher konnte das Modell nur mit einer abgeschlossenen Spracheingabe arbeiten.

Damit dies funktioniert, hat das Team das zugrundeliegende Modell so umgebaut, dass dies eben mit Streams zurechtkommt. Dazu werden nun die Audiodaten stückweise analysiert und das Ergebnis daraus zusammengesetzt. Technische Details zur Vorgehensweise liefert der Blogeintrag.

Zusätzlich zu der Geschwindigkeitssteigerung ist das neue trainierte Modell, das Mozilla zur Weiterverwendung unter einer freien Lizenz bereitstellt, nun nur noch rund 180 MByte groß - eine Reduktion um mehr als 60 Prozent. Ebenso sinkt die maximale Speicherbelastung von 12 GByte auf nur noch 264 MByte.



Anzeige
Spiele-Angebote
  1. 23,99€
  2. 26,95€
  3. 59,99€ mit Vorbesteller-Preisgarantie (Release 26.02.)
  4. (-48%) 12,99€

pitsch 09. Okt 2018

es gibt wohl auch ein raspi projekt zu snips https://medium.com/@zibra_/how-to-build-a...

Kukulkan 20. Sep 2018

Mal im Ernst, es geht mir schon seit einiger Zeit auf den Keks dass man Spracherkennung...

ul mi 20. Sep 2018

hätte man das nicht "Mozilla Free Speech" nennen können? Vermeidet auch, dass sich...

tundracomp 20. Sep 2018

Bei DeepSpeech ist vom relevanten Code wahrscheinlich sowieso 90%+ von Googles TensorFlow...


Folgen Sie uns
       


Need for Speed 3 Hot Pursuit (1998) - Golem retro_

Diese Episode Golem retro_ beleuchtet Need for Speed 3 Hot Pursuit aus dem Jahre 1998. Der dritte Serienteil gilt bis heute bei den Fans als unerreicht gut.

Need for Speed 3 Hot Pursuit (1998) - Golem retro_ Video aufrufen
IT: Frauen, die programmieren und Bier trinken
IT
Frauen, die programmieren und Bier trinken

Fest angestellte Informatiker sind oft froh, nach Feierabend nicht schon wieder in ein Get-together zu müssen. Doch was ist, wenn man kein Team hat und sich selbst Programmieren beibringt? Women Who Code veranstaltet Programmierabende für Frauen, denen es so geht. Golem.de war dort.
Von Maja Hoock

  1. Software-Entwickler CDU will Online-Weiterbildung à la Netflix
  2. Job-Porträt Cyber-Detektiv "Ich musste als Ermittler über 1.000 Onanie-Videos schauen"
  3. Bundesagentur für Arbeit Ausbildungsplätze in der Informatik sind knapp

Requiem zur Cebit: Es war einmal die beste Messe
Requiem zur Cebit
Es war einmal die beste Messe

Nach 33 Jahren ist Schluss mit der Cebit und das ist mehr als schade. Wir waren dabei, als sie noch nicht nur die größte, sondern auch die beste Messe der Welt war - und haben dann erlebt, wie Trends verschlafen wurden. Ein Nachruf.
Von Nico Ernst

  1. IT-Messe Die Cebit wird eingestellt

IMHO: Valves Ka-Ching mit der Brechstange
IMHO
Valves "Ka-Ching" mit der Brechstange

Es klingelt seit Jahren in den Kassen des Unternehmens von Gabe Newell. Dabei ist die Firma tief verschuldet - und zwar in den Herzen der Gamer.
Ein IMHO von Michael Wieczorek

  1. Artifact im Test Zusammengewürfelt und potenziell teuer
  2. Artifact Erste Kritik an Kosten von Valves Sammelkartenspiel
  3. Virtual Reality Valve arbeitet an VR-Headset und Half-Life-Titel

    •  /