Mozilla: Deep Speech unterstützt Transfer Learning

Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.

Artikel veröffentlicht am , Kristian Kißling/Linux Magazin/
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild)
Die Spracherkennung von Mozilla steht in Version 0.7 bereit. (Symbolbild) (Bild: Lionel Bonaventure/AFP via Getty Images)

Die Entwickler von Mozilla haben ihr Spracherkennungssystem Deep Speech in Version 0.7.0 veröffentlicht. Die quelloffene Speech-to-Text-Engine von Mozilla ergänzt unter anderem einen neuen Transfer-Learning-Ansatz. Dieser Ansatz ermöglicht es, bereits existierende und funktionierende Modelle aus ähnlichen Bereichen für neue Einsatzgebiete einfach anzupassen, anstatt das Training von null an neu zu starten.

Stellenmarkt
  1. Inhouse SAP Solution Architect (m/w/d) Beschaffungslogistik unter SAP S / 4HANA
    MTU Aero Engines AG, München
  2. Principal Solution Designer (m/w/d) Sales / Pricing cloud applications
    Vodafone GmbH, Düsseldorf, Eschborn
Detailsuche

Zusätzlich dazu unterstützt das System nun mit Sample DBs ein neues Format für Trainingsdaten, welche die Trainingsgeschwindigkeiten beschleunigen sollen. Des Weiteren ist der Trainingscode von Deep Speech nun einfacher installierbar, es gibt Support für Typescript, ElectronJS 8.0 und Multistream-Support für .NET.

Die aktuelle Version 0.7.0 von Deep Spech ist außerdem nicht rückwärtskompatibel zum Vorgänger. Wer die Software aktualisiert, muss neben dem Code auch die Modelle aktualisieren. Dabei gibt es zwei akustische Modelle: deepspeech-0.7.0-models.pbmm sowie deepspeech-0.7.0-models.tflite. Das erste arbeitet mit Memory-Mapping, ist speichereffizienter und lädt schneller. Das zweite ist gedacht für Tensorflow Lite und ermöglicht eine Quantisierung nach dem Training, um das Modell in ressourcenbeschränkteren Umgebungen zu verschlanken.

Die Deep-Speech-Software von Mozilla ist als Open Source verfügbar, die ersten Arbeiten daran orientieren sich an einer Forschungsveröffentlichung von Baidu, die Mozilla in Tensorflow Lite implementiert hat. Deep Speech übersetzt englische Sprache in geschriebenen Text und lässt sich so beispielsweise einsetzen, um schriftliche Kopien von Vorträgen oder Protokolle anzufertigen oder auch um freie Sprachassistenzsysteme zu entwickeln. Weitere Details zu der aktuellen Version 0.7 liefern die Release Notes.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Microsoft
Sony äußert sich zur Übernahme von Activision Blizzard

Rund 20 Milliarden US-Dollar haben die Aktien von Sony verloren. Nun hat der Konzern erstmals den Kauf von Activision Blizzard kommentiert.

Microsoft: Sony äußert sich zur Übernahme von Activision Blizzard
Artikel
  1. Parallel Systems: Ehemalige SpaceX-Mitarbeiter entwickeln neuartige Güterzüge
    Parallel Systems
    Ehemalige SpaceX-Mitarbeiter entwickeln neuartige Güterzüge

    Das Startup Parallel Systems will konventionelle Züge durch modulare Fahrzeuge mit eigenem Antrieb und Energieversorgung ersetzen.

  2. Digitale-Dienste-Gesetz: Europaparlament will Nutzertracking stark einschränken
    Digitale-Dienste-Gesetz
    Europaparlament will Nutzertracking stark einschränken

    Das Europaparlament hat den Entwurf des Digitale-Dienste-Gesetzes verschärft. Ein Komplettverbot personalisierter Werbung soll es aber nicht geben.

  3. Jahresbilanz: Durch das Vodafone-Kabelnetz liefen 48 Exabyte
    Jahresbilanz
    Durch das Vodafone-Kabelnetz liefen 48 Exabyte

    Unser neues Leben spielt sich tagsüber bei Microsoft Teams ab. Dann verlagern sich die Datenströme in Richtung der Server von Netflix und Amazon.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • LG OLED (2021) 40% günstiger (u.a. 65" 1.599€) • WD Black 1TB SSD 94,90€ • Lenovo Laptops (u.a. 17,3" RTX3080 1.599€) • Gigabyte Mainboard 299,82€ • RTX 3090 2.399€ • RTX 3060 Ti 799€ • MindStar (u.a. 32GB DDR5-6000 389€) • Alternate (u.a. Samsung LED TV 50" 549€) [Werbung]
    •  /