• IT-Karriere:
  • Services:

Mozilla: Deep Speech unterstützt Transfer Learning

Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.

Artikel veröffentlicht am , Kristian Kißling/Linux Magazin/
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild)
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild) (Bild: Lionel Bonaventure/AFP via Getty Images)

Die Entwickler von Mozilla haben ihr Spracherkennungssystem Deep Speech in Version 0.7.0 veröffentlicht. Die quelloffene Speech-to-Text-Engine von Mozilla ergänzt unter anderem einen neuen Transfer-Learning-Ansatz. Dieser Ansatz ermöglicht es, bereits existierende und funktionierende Modelle aus ähnlichen Bereichen für neue Einsatzgebiete einfach anzupassen, anstatt das Training von null an neu zu starten.

Stellenmarkt
  1. AcadeMedia GmbH, München
  2. DMK E-BUSINESS GmbH über Personalwerk Holding GmbH, Chemnitz, Berlin-Potsdam, Köln

Zusätzlich dazu unterstützt das System nun mit Sample DBs ein neues Format für Trainingsdaten, welche die Trainingsgeschwindigkeiten beschleunigen sollen. Des Weiteren ist der Trainingscode von Deep Speech nun einfacher installierbar, es gibt Support für Typescript, ElectronJS 8.0 und Multistream-Support für .NET.

Die aktuelle Version 0.7.0 von Deep Spech ist außerdem nicht rückwärtskompatibel zum Vorgänger. Wer die Software aktualisiert, muss neben dem Code auch die Modelle aktualisieren. Dabei gibt es zwei akustische Modelle: deepspeech-0.7.0-models.pbmm sowie deepspeech-0.7.0-models.tflite. Das erste arbeitet mit Memory-Mapping, ist speichereffizienter und lädt schneller. Das zweite ist gedacht für Tensorflow Lite und ermöglicht eine Quantisierung nach dem Training, um das Modell in ressourcenbeschränkteren Umgebungen zu verschlanken.

Die Deep-Speech-Software von Mozilla ist als Open Source verfügbar, die ersten Arbeiten daran orientieren sich an einer Forschungsveröffentlichung von Baidu, die Mozilla in Tensorflow Lite implementiert hat. Deep Speech übersetzt englische Sprache in geschriebenen Text und lässt sich so beispielsweise einsetzen, um schriftliche Kopien von Vorträgen oder Protokolle anzufertigen oder auch um freie Sprachassistenzsysteme zu entwickeln. Weitere Details zu der aktuellen Version 0.7 liefern die Release Notes.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (u. a. G.Skill 16GB DDR4-3200 Kit für 54,90€, AMD Ryzen 9 3900XT für 419€, MSI B450 Tomahawk...
  2. mit 222,22€ neuer Bestpreis auf Geizhals
  3. (u. a. 970 Evo Plus PCIe-SSD 500GB für 69,30€, T7 Touch Portable SSD 1TB für 137,99€)

Jusito 27. Apr 2020

Ich wollte letztes ein Text to Speech Plugin erstellen und dachte dabei als erstes an...


Folgen Sie uns
       


Geforce RTX 3070 - Test

Die Grafikkarte liegt etwa gleichauf mit der Geforce RTX 2080 Ti.

Geforce RTX 3070 - Test Video aufrufen
Next-Gen: Tolle Indiegames für PS5 und Xbox Series X/S
Next-Gen
Tolle Indiegames für PS5 und Xbox Series X/S

Kaum ein unabhängiger Entwickler hat Dev-Kits für PS5 und Xbox Series X/S - aber The Pathinder und Falconeer sind tolle Next-Gen-Indiegames!
Von Rainer Sigl

  1. Indiegames-Rundschau Raumschiffknacker im Orbit
  2. Rollenspiel Fans übersetzen Disco Elysium ins Deutsche
  3. Indiegames-Rundschau Einmal durchspielen in 400 Tagen

Futuristische Schwebebahn im Testbetrieb: Verkehrsmittel der Zukunft für die dritte Dimension
Futuristische Schwebebahn im Testbetrieb
Verkehrsmittel der Zukunft für die dritte Dimension

Eine Schwebebahn für die Stadt, die jeden Passagier zum Wunschziel bringt - bequem, grün, ohne Stau und vielleicht sogar kostenlos. Ist das realistisch?
Ein Bericht von Werner Pluta

  1. ÖPNV Infraserv Höchst baut Wasserstofftankstelle für Züge

Demon's Souls im Test: Düsternis auf Basis von 10,5 Tflops
Demon's Souls im Test
Düsternis auf Basis von 10,5 Tflops

Das Remake von Demon's Souls ist das einzige PS5-Spiel von Sony, das nicht für die PS4 erscheint - und ein toller Einstieg in die Serie!
Von Peter Steinlechner


      •  /