• IT-Karriere:
  • Services:

Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig

Mit der Initiative Common Voice sammelt Mozilla frei verfügbare Sprachaufnahmen, um damit die eigene Spracherkennung Deep Speech und andere Projekte fördern zu können. Erstmals wird Common Voice nun offiziell mehrsprachig.

Artikel veröffentlicht am ,
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig.
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig. (Bild: Mozilla, Common Voice/CC-BY-SA 3.0)

Das von Mozilla im vergangenen Jahr gestartete Projekt Common Voice wird mehrsprachig. Das gab der für das Projekt zuständige Michael Henretty bekannt. Mit Common Voice sammelt Mozilla per Crowdsourcing Sprachaufnahmen, die unter einer freien Lizenz bereitgestellt werden. Das Common-Voice-Projekt wird nach Englisch nun auch auf offiziell auf Deutsch, Französisch und Walisisch ausgeweitet.

Stellenmarkt
  1. WeGrow GmbH, Tönisvorst
  2. SCHOTT AG, Mitterteich

Alle, die wollen, können der Sprachdatenbank nun ihre Stimme in diesen Sprachen spenden. Dazu lesen Sprecher von Mozilla und der Community vorbereitete Sätze vor und nehmen sich dabei auf. In einem weiteren Teil des Common-Voice-Projektes werden diese Aufnahmen gesprochener Sprache von anderen Nutzern bewertet beziehungsweise validiert. Mozilla hat eine erste Version des Datensatzes für Englisch bereits unter CC-0-Lizenz veröffentlicht.

Ein wichtiger Teil der Arbeiten zur Unterstützung der Mehrsprachigkeit von Common Voice ist neben offensichtlichen Aufgaben wie der Übersetzung der Webseite vor allem die Auswahl des Vorlesematerials. Wie Henretty im Interview mit Golem.de im vergangenem Jahr sagte, bereitet die Suche nach gemeinfreiem oder CC-0-lizenziertem Material noch Probleme. So nutzen historisch gemeinfreie Werke wie Bücher eine im Gegensatz zu heute klar veraltete Sprache, die so wohl kein Sprecher mehr verwenden würde.

Weitere Sprachen in Vorbereitung

Ziel des Projektes ist es, die Daten als Grundlage für Spracherkennungprojekte und verwandte Techniken zu verwenden, wie etwa für Mozillas Deep Speech, das auch den Anstoß für Common Voice gab. Dem Team ist es dabei besonders wichtig, auch kleinere Sprach- und Sprechergemeinschaften repräsentieren zu können, die von kommerziellen Anbietern solcher Systeme oder Datensätze nicht oder wenig beachtet werden.

Zusätzlich zu den vorgestellten Sprachen arbeitet das Team mit seiner Community bereits daran, mehr als 40 weitere Sprachen als Teil von Common Voice zu unterstützen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. (u. a. Struggling für 8,99€, Jurassic World Evolution für 11,25€, Jurassic World Evolution...
  2. 5,99€
  3. (u. a. Stellaris Galaxy Edition für 11,99€, Stellaris: Apocalypse für 9,50€)
  4. 23,99€

Folgen Sie uns
       


Einfache Fluid-Simulation in Blender - Tutorial

Wir zeigen im Video, wie man in 15 Minuten eine Flüssigkeit in Blender animiert.

Einfache Fluid-Simulation in Blender - Tutorial Video aufrufen
Mario Kart Live im Test: Ein Klempner, der um Konsolen kurvt
Mario Kart Live im Test
Ein Klempner, der um Konsolen kurvt

In Mario Kart Live (Nintendo Switch) fährt ein Klempner durchs Wohnzimmer. Golem.de hat das Spiel mit einem Konsolen-Rennkurs ausprobiert.
Von Peter Steinlechner

  1. Nintendo Entwickler arbeiten offenbar an 4K-Updates für Switch Pro
  2. Nintendo Switch Mario Kart Live schickt Spielzeugauto auf VR-Rennstecke
  3. 8bitdo Controller macht die Nintendo Switch zum Arcade-Kabinett

The Secret of Monkey Island: Ich bin ein übelriechender, groggurgelnder Pirat!
The Secret of Monkey Island
"Ich bin ein übelriechender, groggurgelnder Pirat!"

Das wunderbare The Secret of Monkey Island feiert seinen 30. Geburtstag. Golem.de hat einen neuen Durchgang gewagt - und wüst geschimpft.
Von Benedikt Plass-Fleßenkämper


    Philips-Leuchten-Konfigurator im Test: Die schicke Leuchte aus dem 3D-Drucker
    Philips-Leuchten-Konfigurator im Test
    Die schicke Leuchte aus dem 3D-Drucker

    Signify bietet mit Philips My Creation die Möglichkeit, eigene Leuchten zu kreieren. Diese werden im 3D-Drucker gefertigt - und sind von überraschend guter Qualität. Golem.de hat eine güldene Leuchte entworfen.
    Ein Test von Tobias Költzsch

    1. Smarte Leuchten mit Kurzschluss Netzteil-Rückruf bei Philips Hue Outdoor
    2. Signify Neue Lampen, Leuchten und Lightstrips von Philips Hue
    3. Signify Neue Philips-Hue-Produkte vorgestellt

      •  /