Mozilla: Deep Speech unterstützt Transfer Learning

Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.

Artikel veröffentlicht am , Kristian Kißling/Linux Magazin/
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild)
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild) (Bild: Lionel Bonaventure/AFP via Getty Images)

Die Entwickler von Mozilla haben ihr Spracherkennungssystem Deep Speech in Version 0.7.0 veröffentlicht. Die quelloffene Speech-to-Text-Engine von Mozilla ergänzt unter anderem einen neuen Transfer-Learning-Ansatz. Dieser Ansatz ermöglicht es, bereits existierende und funktionierende Modelle aus ähnlichen Bereichen für neue Einsatzgebiete einfach anzupassen, anstatt das Training von null an neu zu starten.

Stellenmarkt
  1. Wissenschaftler*in - Internet der Dinge (IOT) - mit Promotionsmöglichkeit
    Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB, Karlsruhe
  2. Mitarbeiterin / Mitarbeiter (w/m/d) Systembetreuung mit Schwerpunkt Buchhaltung
    Berliner Stadtreinigungsbetriebe (BSR), Berlin
Detailsuche

Zusätzlich dazu unterstützt das System nun mit Sample DBs ein neues Format für Trainingsdaten, welche die Trainingsgeschwindigkeiten beschleunigen sollen. Des Weiteren ist der Trainingscode von Deep Speech nun einfacher installierbar, es gibt Support für Typescript, ElectronJS 8.0 und Multistream-Support für .NET.

Die aktuelle Version 0.7.0 von Deep Spech ist außerdem nicht rückwärtskompatibel zum Vorgänger. Wer die Software aktualisiert, muss neben dem Code auch die Modelle aktualisieren. Dabei gibt es zwei akustische Modelle: deepspeech-0.7.0-models.pbmm sowie deepspeech-0.7.0-models.tflite. Das erste arbeitet mit Memory-Mapping, ist speichereffizienter und lädt schneller. Das zweite ist gedacht für Tensorflow Lite und ermöglicht eine Quantisierung nach dem Training, um das Modell in ressourcenbeschränkteren Umgebungen zu verschlanken.

Die Deep-Speech-Software von Mozilla ist als Open Source verfügbar, die ersten Arbeiten daran orientieren sich an einer Forschungsveröffentlichung von Baidu, die Mozilla in Tensorflow Lite implementiert hat. Deep Speech übersetzt englische Sprache in geschriebenen Text und lässt sich so beispielsweise einsetzen, um schriftliche Kopien von Vorträgen oder Protokolle anzufertigen oder auch um freie Sprachassistenzsysteme zu entwickeln. Weitere Details zu der aktuellen Version 0.7 liefern die Release Notes.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Finanzierungsrunde
Onlyfans ist über 1 Milliarde US-Dollar wert

Prominente, Influencer und Erotikfilmstars zeigen sich hier freizügig. Der Umsatz von Onlyfans steigt derzeit stark an.

Finanzierungsrunde: Onlyfans ist über 1 Milliarde US-Dollar wert
Artikel
  1. Netflix: Warum so viele Serien nur zwei Staffeln lang laufen
    Netflix
    Warum so viele Serien nur zwei Staffeln lang laufen

    Die Superhelden-Serie Jupiter's Legacy war bei ihrem Start ein Erfolg bei Netflix. Jetzt wurde sie eingestellt. Wie entscheidet Netflix, ob eine Serie verlängert wird?
    Von Peter Osteried

  2. CD Projekt Red: Update 1.23 für Cyberpunk 2077 mit CPU-Optimierungen
    CD Projekt Red
    Update 1.23 für Cyberpunk 2077 mit CPU-Optimierungen

    Kurz vor dem Neustart von Cyberpunk 2077 im Playstation Store hat CD Projekt Red das Update auf Version 1.23 veröffentlicht.

  3. Model S Plaid: Teslas Knight-Rider-Lenkrad könnte ergonomischer Krampf sein
    Model S Plaid
    Teslas Knight-Rider-Lenkrad könnte ergonomischer Krampf sein

    Das D-förmige Lenkrad im neuen Tesla Model S sorgt für Kontroversen. Erste Fahrer haben es ausprobiert und sind nicht glücklich damit.

Jusito 27. Apr 2020

Ich wollte letztes ein Text to Speech Plugin erstellen und dachte dabei als erstes an...


Folgen Sie uns
       


  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • PS5 bei o2 bestellbar • Xbox Series X bei MM bestellbar 499,99€ • Breaking Deals (u. a. LG 75" Nanocell 8K 2.699€) • Corsair 32GB 3600 Kit 182,90€ • Ab 18 Uhr: Sharkoon Live Shopping: bis 40% Rabatt • PCGH Gaming-PC RX 6800 XT 2.500€ • Rabatt auf Geschenkkarten bei Amazon [Werbung]
    •  /