Original-URL des Artikels: https://www.golem.de/news/mozilla-deep-speech-unterstuetzt-transfer-learning-2004-148112.html    Veröffentlicht: 27.04.2020 16:05    Kurz-URL: https://glm.io/148112

Mozilla

Deep Speech unterstützt Transfer Learning

Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.

Die Entwickler von Mozilla haben ihr Spracherkennungssystem Deep Speech in Version 0.7.0 veröffentlicht. Die quelloffene Speech-to-Text-Engine von Mozilla ergänzt unter anderem einen neuen Transfer-Learning-Ansatz. Dieser Ansatz ermöglicht es, bereits existierende und funktionierende Modelle aus ähnlichen Bereichen für neue Einsatzgebiete einfach anzupassen, anstatt das Training von null an neu zu starten.

Zusätzlich dazu unterstützt das System nun mit Sample DBs ein neues Format für Trainingsdaten, welche die Trainingsgeschwindigkeiten beschleunigen sollen. Des Weiteren ist der Trainingscode von Deep Speech nun einfacher installierbar, es gibt Support für Typescript, ElectronJS 8.0 und Multistream-Support für .NET.

Die aktuelle Version 0.7.0 von Deep Spech ist außerdem nicht rückwärtskompatibel zum Vorgänger. Wer die Software aktualisiert, muss neben dem Code auch die Modelle aktualisieren. Dabei gibt es zwei akustische Modelle: deepspeech-0.7.0-models.pbmm sowie deepspeech-0.7.0-models.tflite. Das erste arbeitet mit Memory-Mapping, ist speichereffizienter und lädt schneller. Das zweite ist gedacht für Tensorflow Lite und ermöglicht eine Quantisierung nach dem Training, um das Modell in ressourcenbeschränkteren Umgebungen zu verschlanken.

Die Deep-Speech-Software von Mozilla ist als Open Source verfügbar, die ersten Arbeiten daran orientieren sich an einer Forschungsveröffentlichung von Baidu, die Mozilla in Tensorflow Lite implementiert hat. Deep Speech übersetzt englische Sprache in geschriebenen Text und lässt sich so beispielsweise einsetzen, um schriftliche Kopien von Vorträgen oder Protokolle anzufertigen oder auch um freie Sprachassistenzsysteme zu entwickeln. Weitere Details zu der aktuellen Version 0.7 liefern die Release Notes.

 (lm-kki)


Verwandte Artikel:
Mozilla: Deep Speech wird klein und schnell   
(06.12.2019, https://glm.io/145392 )
Coronavirus: Medizinische Suchmaschine hilft Ärzten bei Covid-19-Diagnose   
(27.04.2020, https://glm.io/148104 )
Deep Fakes: Software imitiert Steve Jobs und Elon Musk in Zoom   
(20.04.2020, https://glm.io/147971 )
WebGL: Mozilla testet WebGPU-API in Firefox-Nightly   
(24.04.2020, https://glm.io/148066 )
Machine Learning: Microsoft setzt auf KI zum Finden von Sicherheitslücken   
(20.04.2020, https://glm.io/147969 )

© 1997–2021 Golem.de, https://www.golem.de/