Abo
  • IT-Karriere:

Deep Speech 0.2: Mozillas Spracherkennung wird kleiner und kann Echtzeit

Mit Deep Speech will Mozilla ein freies System zur Spracherkennung bereitstellen. Die aktuelle Version 0.2 ist nun deutlich kleiner und ermöglicht Echtzeitanwendungen für die Spracherkennung, wie das automatische Erstellen von Untertiteln.

Artikel veröffentlicht am ,
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele.
Mozillas Deep Speech erstellt ein freies Sprachmodell, Common Voice sammelt freie Sprachbeispiele. (Bild: Mozilla/CC-BY 3.0)

Damit das Feld der Spracherkennung langfristig nicht wie bisher von Amazon, Google und Microsoft dominiert bleibt, hat sich Mozilla die ambitionierte Aufgabe gestellt, eine eigene und vor allem freie Spracherkennung zu entwickeln. Dieses als Deep Speech bezeichnete Projekt steht nun in Version 0.2 bereit, das eine Echtzeitanwendung ermöglicht.

Stellenmarkt
  1. S&G Automobil AG, Karlsruhe-Knielingen
  2. über experteer GmbH, Stuttgart

Das eröffne eine Vielzahl verschiedener Einsatzmöglichkeiten für Deep Speech wie "Live-Untertitel für Radioprogramme, Twitch-Streams und Keynote-Präsentationen, Heimautomatisierung, sprachbasierte UIs" und Weiteres, wie der beteiligte Entwickler Reuben Morais in einem Blogeintrag schreibt.

Stream-Verarbeitung beim Inferencing

Das heißt, die Verarbeitung von Daten sowie die Anwendung des trainierten Modells - das Inferencing - ist nun nicht nur schneller als das Sprachsample lang ist, sondern das neue Modell kann das Inferencing auch schon während der Aufnahme der Sprachdaten beginnen. Bisher konnte das Modell nur mit einer abgeschlossenen Spracheingabe arbeiten.

Damit dies funktioniert, hat das Team das zugrundeliegende Modell so umgebaut, dass dies eben mit Streams zurechtkommt. Dazu werden nun die Audiodaten stückweise analysiert und das Ergebnis daraus zusammengesetzt. Technische Details zur Vorgehensweise liefert der Blogeintrag.

Zusätzlich zu der Geschwindigkeitssteigerung ist das neue trainierte Modell, das Mozilla zur Weiterverwendung unter einer freien Lizenz bereitstellt, nun nur noch rund 180 MByte groß - eine Reduktion um mehr als 60 Prozent. Ebenso sinkt die maximale Speicherbelastung von 12 GByte auf nur noch 264 MByte.



Anzeige
Top-Angebote
  1. 139€
  2. (u. a. AMD Ryzen + ASUS-X570-Mainboard kaufen und bis zu 125€ sparen)
  3. (u. a. Hunt Showdown für 29,99€, Forza Motorsport 7 für 28,49€ und Hitman 2 für 14,49€)
  4. (heute u. a. Xbox One Bundles mit FIFA 20)

pitsch 09. Okt 2018

es gibt wohl auch ein raspi projekt zu snips https://medium.com/@zibra_/how-to-build-a...

Kukulkan 20. Sep 2018

Mal im Ernst, es geht mir schon seit einiger Zeit auf den Keks dass man Spracherkennung...

ul mi 20. Sep 2018

hätte man das nicht "Mozilla Free Speech" nennen können? Vermeidet auch, dass sich...

tundracomp 20. Sep 2018

Bei DeepSpeech ist vom relevanten Code wahrscheinlich sowieso 90%+ von Googles TensorFlow...


Folgen Sie uns
       


Nokia 6.2 und 7.2 - Hands on

Das Nokia 6.2 und das Nokia 7.2 sind zwei Android-Smartphones im Mittelklassesegment. Beide sind Teil des Android-One-Programms und dürften entsprechend schnelle Updates erhalten.

Nokia 6.2 und 7.2 - Hands on Video aufrufen
Sonos Move im Test: Der vielseitigste Lautsprecher von Sonos
Sonos Move im Test
Der vielseitigste Lautsprecher von Sonos

Der Move von Sonos überzeugt durch Bluetooth und ist dank Akku und stabilem Gehäuse vorzüglich für den Außeneinsatz geeignet. Bei den Funktionen ist der Lautsprecher leider nicht so smart wie er sein könnte.
Ein Test von Ingo Pakalski

  1. Update für Multiroom-Lautsprecher Sonos-App spielt keine lokalen Inhalte mehr vom iPhone ab
  2. Smarter Lautsprecher Erster Sonos-Lautsprecher mit Akku und Bluetooth
  3. Soundbars Audiohersteller Teufel investiert in eigene Ladenkette

Astronomie: K2-18b ist weder eine zweite Erde noch super
Astronomie
K2-18b ist weder eine zweite Erde noch super

Die Realität sieht anders aus, als manche Überschrift vermuten lässt. Die neue Entdeckung von Wasser auf einem Exoplaneten deutet nicht auf Leben hin, dafür aber auf Probleme im Wissenschaftsbetrieb.
Von Frank Wunderlich-Pfeiffer

  1. Interview Heino Falcke "Wir machen Wettermodelle für schwarze Löcher"

HP Pavilion Gaming 15 im Test: Günstig gut gamen
HP Pavilion Gaming 15 im Test
Günstig gut gamen

Mit dem Pavilion Gaming 15 bietet HP für 1.000 Euro ein Spiele-Notebook an, das für aktuelle Titel genügend 1080p-Leistung hat. Auch Bildschirm und Ports taugen, dafür nervt uns die voreingestellte 30-fps-Akku-Drossel.
Ein Test von Marc Sauter

  1. Gaming-Notebooks Asus ROG mit Core i9 und fixen oder farbstarken Displays

    •  /