Abo
  • Services:

Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig

Mit der Initiative Common Voice sammelt Mozilla frei verfügbare Sprachaufnahmen, um damit die eigene Spracherkennung Deep Speech und andere Projekte fördern zu können. Erstmals wird Common Voice nun offiziell mehrsprachig.

Artikel veröffentlicht am ,
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig.
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig. (Bild: Mozilla, Common Voice/CC-BY-SA 3.0)

Das von Mozilla im vergangenen Jahr gestartete Projekt Common Voice wird mehrsprachig. Das gab der für das Projekt zuständige Michael Henretty bekannt. Mit Common Voice sammelt Mozilla per Crowdsourcing Sprachaufnahmen, die unter einer freien Lizenz bereitgestellt werden. Das Common-Voice-Projekt wird nach Englisch nun auch auf offiziell auf Deutsch, Französisch und Walisisch ausgeweitet.

Stellenmarkt
  1. Robert Bosch GmbH, Stuttgart
  2. CSL Behring GmbH, Marburg, Hattersheim am Main

Alle, die wollen, können der Sprachdatenbank nun ihre Stimme in diesen Sprachen spenden. Dazu lesen Sprecher von Mozilla und der Community vorbereitete Sätze vor und nehmen sich dabei auf. In einem weiteren Teil des Common-Voice-Projektes werden diese Aufnahmen gesprochener Sprache von anderen Nutzern bewertet beziehungsweise validiert. Mozilla hat eine erste Version des Datensatzes für Englisch bereits unter CC-0-Lizenz veröffentlicht.

Ein wichtiger Teil der Arbeiten zur Unterstützung der Mehrsprachigkeit von Common Voice ist neben offensichtlichen Aufgaben wie der Übersetzung der Webseite vor allem die Auswahl des Vorlesematerials. Wie Henretty im Interview mit Golem.de im vergangenem Jahr sagte, bereitet die Suche nach gemeinfreiem oder CC-0-lizenziertem Material noch Probleme. So nutzen historisch gemeinfreie Werke wie Bücher eine im Gegensatz zu heute klar veraltete Sprache, die so wohl kein Sprecher mehr verwenden würde.

Weitere Sprachen in Vorbereitung

Ziel des Projektes ist es, die Daten als Grundlage für Spracherkennungprojekte und verwandte Techniken zu verwenden, wie etwa für Mozillas Deep Speech, das auch den Anstoß für Common Voice gab. Dem Team ist es dabei besonders wichtig, auch kleinere Sprach- und Sprechergemeinschaften repräsentieren zu können, die von kommerziellen Anbietern solcher Systeme oder Datensätze nicht oder wenig beachtet werden.

Zusätzlich zu den vorgestellten Sprachen arbeitet das Team mit seiner Community bereits daran, mehr als 40 weitere Sprachen als Teil von Common Voice zu unterstützen.



Anzeige
Spiele-Angebote
  1. 4,99€
  2. 32,99€ (erscheint am 25.01.)
  3. 4,99€

Folgen Sie uns
       


Eine kurze Geschichte des CCC - die 1980er

DFÜ, BTX und KGB - wir zeigen die Anfänge des Chaos Computer Club im Video.

Eine kurze Geschichte des CCC - die 1980er Video aufrufen
Datenleak: Die Fehler, die 0rbit überführten
Datenleak
Die Fehler, die 0rbit überführten

Er ließ sich bei einem Hack erwischen, vermischte seine Pseudonyme und redete zu viel - Johannes S. hinterließ viele Spuren. Trotzdem brauchte die Polizei offenbar einen Hinweisgeber, um ihn als mutmaßlichen Täter im Politiker-Hack zu überführen.

  1. Datenleak Bundestagsabgeordnete sind Zwei-Faktor-Muffel
  2. Datenleak Telekom und Politiker wollen härtere Strafen für Hacker
  3. Datenleak BSI soll Frühwarnsystem für Hackerangriffe aufbauen

Geforce RTX 2060 im Test: Gute Karte zum gutem Preis mit Speicher-Aber
Geforce RTX 2060 im Test
Gute Karte zum gutem Preis mit Speicher-Aber

Mit der Geforce RTX 2060 hat Nvidia die bisher günstigste Grafikkarte mit Turing-Architektur veröffentlicht. Für 370 Euro erhalten Spieler genug Leistung für 1080p oder 1440p und sogar für Raytracing, bei vollen Schatten- oder Textur-Details wird es aber in seltenen Fällen ruckelig.
Ein Test von Marc Sauter

  1. Geforce RTX 2060 Founder's Edition kostet 370 Euro
  2. Turing-Architektur Nvidia stellt schnelle Geforce RTX für Notebooks vor
  3. Turing-Grafikkarte Nvidia plant Geforce RTX 2060

Slighter im Hands on: Wenn das Feuerzeug smarter als der Raucher ist
Slighter im Hands on
Wenn das Feuerzeug smarter als der Raucher ist

CES 2019 Mit Slighter könnte ausgerechnet ein Feuerzeug Rauchern beim Aufhören helfen: Ausgehend von den Rauchgewohnheiten erstellt es einen Plan - und gibt nur zu ganz bestimmten Zeiten eine Flamme.
Ein Hands on von Tobias Költzsch

  1. Smart Tab Lenovo zeigt Mischung aus Android-Tablet und Echo Show
  2. Royole Flexpai im Hands on Display top, Software flop
  3. Alienware Area 51m angesehen Aufrüstbares Gaming-Notebook mit frischem Design

    •  /