Deep Speech und Common Voice: Mozilla bringt freie Spracherkennung für alle

Mit Deep Speech steht ein erstes freies Modell zur Spracherkennung von Mozilla bereit. Parallel dazu sammelt Mozilla mit Common Voice die Sprachdaten dafür und stellt diese ebenfalls frei zu Verfügung. Golem.de hat mit den Verantwortlichen der beiden Projekte gesprochen.

Artikel von veröffentlicht am
Mozilla stellt eine freie Spracherkennung bereit ebenso wie Sprachdaten.
Mozilla stellt eine freie Spracherkennung bereit ebenso wie Sprachdaten. (Bild: Mozilla/CC-BY 3.0)

Der Aufbau eines Modells zur Spracherkennung sei rechenintensiv und teuer, erklärt Kelly Davis, der Manager der Machine Learning Group in Mozillas Emerging-Technologies-Sparte, im Gespräch mit Golem.de. Das sei wohl auch der Grund, so mutmaßt Davis, warum das Feld der Spracherkennung bisher von Amazon, Google und Microsoft dominiert werde. Die Einstiegshürden für andere seien schlicht zu hoch.


Weitere Golem-Plus-Artikel
New Space: Raketenwissenschaft aus Deutschland
New Space: Raketenwissenschaft aus Deutschland

Raumfahrt ist längst nicht mehr nur Sache der großen staatlichen Behörden. Uni-Initiativen und Start-ups entwickeln Satelliten und sogar Raketen. Ein Überblick, in welchen Bereichen sich deutsche New-Space-Unternehmen tummeln.
Ein Bericht von Werner Pluta


SAP Event Mesh: Eventbasierte Anwendungen in der SAP-Welt
SAP Event Mesh: Eventbasierte Anwendungen in der SAP-Welt

Eventbasierte Architektur in SAP-Systemen, ganz ohne Vendor Lock-in: Der Service SAP Event Mesh ist attraktiv, hat aber auch seine Grenzen.
Ein Deep Dive von Volker Buzek


Kaufberatung: Der Weg zum richtigen Notebook
Kaufberatung: Der Weg zum richtigen Notebook

Bei der Auswahl des passenden Notebooks kann viel falsch gemacht werden. Golem.de gibt Tipps, wie man es richtig macht.
Ein Ratgebertext von Oliver Nickel


    •  /