• IT-Karriere:
  • Services:

Common Voice sammelt freie Sprachdaten

Zusätzlich zu dem trainierten Modell sowie dem dazugehörigen Code stellt Mozilla einen sehr großen Korpus mit Sprachaufnahmen bereit. Laut Mozilla ist das sogar schon der zweitgrößte frei verfügbare Datensatz mit Sprachaufnahmen. Gesammelt worden sind diese Sprachaufzeichnungen über das Mozilla-Projekt Common Voice. Bisher umfassen die Daten von Common Voice "400.000 einzelne Aufnahmen von 20.000 verschiedenen Personen, was 500 Stunden gesprochene Sprache ergibt".

Stellenmarkt
  1. Friedrich Lange GmbH Fachgroßhandel für Sanitär und Heizung, Hamburg
  2. über Hays AG, Berlin

Der Name Common Voice sei dabei in Anlehnung an die Creative Commons gewählt, erklärt Michael Henretty, Digital Strategist bei Mozilla Open Innovation, und damit natürlich auch auf das Konzept der Commons, also eines frei verfügbaren Allgemeingutes. Die Idee zu Common Voice ist im Prinzip aus dem Deep-Speech-Projekt heraus entstanden, erklärt Henretty. Das freie Modell sollte durch freie Quelldaten begleitet werden. Analog zu Deep Speech soll auch der freie Datensatz von Common Voice helfen, die Einstiegshürden in die Nutzung von Spracherkennungssystemen zu überwinden.

Ein weiterer Vorteil von Common Voice, vor allem mit Blick auf Deep Speech, sei laut Henretty, dass die gesammelten Daten von sehr diversen Sprechern stamme, immerhin könne jeder auf der Welt einfach zu der Sammlung beitragen. Diese Diversität wiederum trage zu einer gewissen Robustheit der damit trainierten Spracherkennung bei, da auch Unterschiede in der Aussprache wie etwa verschiedene Akzente besser abgebildet werden können.

Ein noch großes Problem für Common Voice ist die Auswahl der Vorlesematerials für die Sprachaufzeichnungen. Diese müssen gemeinfrei oder CC-0-lizenziert sein, um auch die aufgezeichneten Daten unter entsprechender Lizenz veröffentlichen zu können. Historisch gemeinfreie Werke wie Bücher nutzten aber eine im Gegensatz zu heute klar veraltete Sprache, die so wohl kein Sprecher mehr verwenden würde. Deshalb bittet das Common-Voice-Projekt darum, zum Beispiel auch aktuelle Blog-Einträge oder Ähnliches zu "spenden".

Golem Akademie
  1. PostgreSQL Fundamentals
    15.-18. Juni 2021, online
  2. Terraform mit AWS
    14./15. September 2021, online
Weitere IT-Trainings

Bisher stehen die Daten von Common Voice nur in Englisch zur Verfügung, das soll aber ebenfalls im kommenden Jahr auf weitere Sprachen ausgeweitet werden. Die Mozilla-Community ist hier eine wichtige Stütze, diese hat teils schon vor Wochen oder Monaten damit angefangen, die Webseite und App zum Sammeln der Daten in andere Sprachen zu übersetzen und nach passendem Quellmaterial zu suchen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Deep Speech und Common Voice: Mozilla bringt freie Spracherkennung für alle
  1.  
  2. 1
  3. 2


Anzeige
Spiele-Angebote
  1. 25,99€
  2. (u. a. Standard Edition PC für 44,99€, Xbox One / Series S/X für 62,99€, Deluxe Edition PC...

felix.schwarz 30. Nov 2017

Direkt mitmachen kann man immerhin jetzt schon bei "Common Voice" (https://voice.mozilla...

Hypfer 30. Nov 2017

Ach DA! Wow. Danke!


Folgen Sie uns
       


Resident Evil Village - Fazit

Im Video stelle Golem.de die Stärken und Schwächen des Horror-Abenteuers Resident Evil 8 Village vor.

Resident Evil Village - Fazit Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /