Mozilla: Deep Speech unterstützt Transfer Learning

Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.

Artikel veröffentlicht am , Kristian Kißling/Linux Magazin/
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild)
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild) (Bild: Lionel Bonaventure/AFP via Getty Images)

Die Entwickler von Mozilla haben ihr Spracherkennungssystem Deep Speech in Version 0.7.0 veröffentlicht. Die quelloffene Speech-to-Text-Engine von Mozilla ergänzt unter anderem einen neuen Transfer-Learning-Ansatz. Dieser Ansatz ermöglicht es, bereits existierende und funktionierende Modelle aus ähnlichen Bereichen für neue Einsatzgebiete einfach anzupassen, anstatt das Training von null an neu zu starten.

Zusätzlich dazu unterstützt das System nun mit Sample DBs ein neues Format für Trainingsdaten, welche die Trainingsgeschwindigkeiten beschleunigen sollen. Des Weiteren ist der Trainingscode von Deep Speech nun einfacher installierbar, es gibt Support für Typescript, ElectronJS 8.0 und Multistream-Support für .NET.

Die aktuelle Version 0.7.0 von Deep Spech ist außerdem nicht rückwärtskompatibel zum Vorgänger. Wer die Software aktualisiert, muss neben dem Code auch die Modelle aktualisieren. Dabei gibt es zwei akustische Modelle: deepspeech-0.7.0-models.pbmm sowie deepspeech-0.7.0-models.tflite. Das erste arbeitet mit Memory-Mapping, ist speichereffizienter und lädt schneller. Das zweite ist gedacht für Tensorflow Lite und ermöglicht eine Quantisierung nach dem Training, um das Modell in ressourcenbeschränkteren Umgebungen zu verschlanken.

Die Deep-Speech-Software von Mozilla ist als Open Source verfügbar, die ersten Arbeiten daran orientieren sich an einer Forschungsveröffentlichung von Baidu, die Mozilla in Tensorflow Lite implementiert hat. Deep Speech übersetzt englische Sprache in geschriebenen Text und lässt sich so beispielsweise einsetzen, um schriftliche Kopien von Vorträgen oder Protokolle anzufertigen oder auch um freie Sprachassistenzsysteme zu entwickeln. Weitere Details zu der aktuellen Version 0.7 liefern die Release Notes.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Custom Keyboard
Youtuber baut riesige Tastatur für 13.500 Euro

Die Switches haben das 64-fache Volumen und das Gehäuse ist menschenhoch: Ein Youtuber baut eine absurd große Tastatur für absurd viel Geld.

Custom Keyboard: Youtuber baut riesige Tastatur für 13.500 Euro
Artikel
  1. Super Nintendo: Fan bringt verbessertes Zelda 3 für Windows, MacOS und Linux
    Super Nintendo
    Fan bringt verbessertes Zelda 3 für Windows, MacOS und Linux

    Aus 80.000 Zeilen C-Code besteht die per Reverse Engineering generierte Version von Zelda 3. Die bringt einige Verbesserungen und 16:9.

  2. Twitter: Der blaue Haken bringt Musk nur wenig Geld
    Twitter
    Der blaue Haken bringt Musk nur wenig Geld

    Weltweit hat Twitter angeblich schon einige Hunderttausend zahlende Nutzer. Das dürfte die Finanzprobleme aber nur wenig mildern.

  3. Linux: Alte Computer zu neuem Leben erwecken
    Linux
    Alte Computer zu neuem Leben erwecken

    Computer sind schon nach wenigen Jahren Nutzungsdauer veraltet. Doch mit den schlanken Linux-Distributionen AntiX-Linux, Q4OS oder Simply Linux erleben ältere PC-Systeme einen zweiten Frühling.
    Von Erik Bärwaldt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • DAMN-Deals: AMD CPUs zu Tiefstpreisen (u. a. R7 5800X3D 324€)• MindStar: Zotac RTX 4070 Ti 949€, XFX RX 6800 519€ • WSV-Finale bei MediaMarkt (u. a. Samsung 980 Pro 2 TB Heatsink 199,99€) • RAM im Preisrutsch • Powercolor RX 7900 XTX 1.195€ • PCGH Cyber Week nur noch kurze Zeit [Werbung]
    •  /