Abo
  • Services:

Common Voice sammelt freie Sprachdaten

Zusätzlich zu dem trainierten Modell sowie dem dazugehörigen Code stellt Mozilla einen sehr großen Korpus mit Sprachaufnahmen bereit. Laut Mozilla ist das sogar schon der zweitgrößte frei verfügbare Datensatz mit Sprachaufnahmen. Gesammelt worden sind diese Sprachaufzeichnungen über das Mozilla-Projekt Common Voice. Bisher umfassen die Daten von Common Voice "400.000 einzelne Aufnahmen von 20.000 verschiedenen Personen, was 500 Stunden gesprochene Sprache ergibt".

Stellenmarkt
  1. über duerenhoff GmbH, Raum Dortmund
  2. Bosch Gruppe, Magdeburg

Der Name Common Voice sei dabei in Anlehnung an die Creative Commons gewählt, erklärt Michael Henretty, Digital Strategist bei Mozilla Open Innovation, und damit natürlich auch auf das Konzept der Commons, also eines frei verfügbaren Allgemeingutes. Die Idee zu Common Voice ist im Prinzip aus dem Deep-Speech-Projekt heraus entstanden, erklärt Henretty. Das freie Modell sollte durch freie Quelldaten begleitet werden. Analog zu Deep Speech soll auch der freie Datensatz von Common Voice helfen, die Einstiegshürden in die Nutzung von Spracherkennungssystemen zu überwinden.

Ein weiterer Vorteil von Common Voice, vor allem mit Blick auf Deep Speech, sei laut Henretty, dass die gesammelten Daten von sehr diversen Sprechern stamme, immerhin könne jeder auf der Welt einfach zu der Sammlung beitragen. Diese Diversität wiederum trage zu einer gewissen Robustheit der damit trainierten Spracherkennung bei, da auch Unterschiede in der Aussprache wie etwa verschiedene Akzente besser abgebildet werden können.

Ein noch großes Problem für Common Voice ist die Auswahl der Vorlesematerials für die Sprachaufzeichnungen. Diese müssen gemeinfrei oder CC-0-lizenziert sein, um auch die aufgezeichneten Daten unter entsprechender Lizenz veröffentlichen zu können. Historisch gemeinfreie Werke wie Bücher nutzten aber eine im Gegensatz zu heute klar veraltete Sprache, die so wohl kein Sprecher mehr verwenden würde. Deshalb bittet das Common-Voice-Projekt darum, zum Beispiel auch aktuelle Blog-Einträge oder Ähnliches zu "spenden".

Bisher stehen die Daten von Common Voice nur in Englisch zur Verfügung, das soll aber ebenfalls im kommenden Jahr auf weitere Sprachen ausgeweitet werden. Die Mozilla-Community ist hier eine wichtige Stütze, diese hat teils schon vor Wochen oder Monaten damit angefangen, die Webseite und App zum Sammeln der Daten in andere Sprachen zu übersetzen und nach passendem Quellmaterial zu suchen.

 Deep Speech und Common Voice: Mozilla bringt freie Spracherkennung für alle
  1.  
  2. 1
  3. 2


Anzeige
Hardware-Angebote

felix.schwarz 30. Nov 2017

Direkt mitmachen kann man immerhin jetzt schon bei "Common Voice" (https://voice.mozilla...

Hypfer 30. Nov 2017

Ach DA! Wow. Danke!


Folgen Sie uns
       


Pathfinder Kingmaker - Golem.de live (Teil 2)

In Teil 2 unseres Livestreams wächst nicht nur unsere Party, sondern es gibt auch beim Endkampf jede Menge Drama, Wut und Liebe im Chat.

Pathfinder Kingmaker - Golem.de live (Teil 2) Video aufrufen
Battlefield 5 im Test: Klasse Kämpfe unter Freunden
Battlefield 5 im Test
Klasse Kämpfe unter Freunden

Umgebungen und Szenario erinnern an frühere Serienteile, das Sammeln von Ausrüstung motiviert langfristig, viele Gebiete sind zerstörbar: Battlefield 5 setzt auf Multiplayermatches für erfahrene Squads. Wer lange genug kämpft, findet schon vor der Erweiterung Firestorm ein bisschen Battle Royale.

  1. Dice Raytracing-Systemanforderungen für Battlefield 5 erschienen
  2. Dice Zusatzinhalte für Battlefield 5 vorgestellt
  3. Battle Royale Battlefield 5 schickt 64 Spieler in Feuerring

Geforce RTX 2070 im Test: Diese Turing-Karte ist ihr Geld wert
Geforce RTX 2070 im Test
Diese Turing-Karte ist ihr Geld wert

Die Geforce RTX 2070 ist die günstigste oder eher am wenigsten teure Turing-Grafikkarte von Nvidia. Sie ist schneller und sparsamer als eine Geforce GTX 1080 oder Vega 64 und kostet je nach Modell fast genauso viel. Wir haben zwei Geforce-RTX-2070-Varianten von Asus und MSI getestet.
Ein Test von Marc Sauter

  1. Turing-Grafikkarten Geforce RTX werden sparsamer bei multiplen Displays
  2. Turing-Grafikkarten Nvidias Founder's Editions gehen offenbar reihenweise kaputt
  3. Nvidia Turing Geforce RTX sollen Adobe Dimension beschleunigen

Sony RX100 VI im Test: Besser geht Kompaktkamera kaum
Sony RX100 VI im Test
Besser geht Kompaktkamera kaum

2012 hat die Sony seine Kompaktkameraserie RX100 gestartet. Das neue Modell RX100 VI mit extra großem Zoom zeigt, dass sich auch eine gute Kamera immer noch verbessern lässt. Perfekt ist sie jedoch immer noch nicht.
Ein Test von Andreas Donath

  1. M10-D Leica nimmt Digitalkamera absichtlich das Display
  2. Keine Speicherkarten Zeiss plant Vollformatkamera ZX1 mit eingebautem Lightroom
  3. Insta 360 Pro 2 Neue Profi-360-Grad-Kamera nimmt 3D-Videos in 8K auf

    •  /