Abo
  • Services:

Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig

Mit der Initiative Common Voice sammelt Mozilla frei verfügbare Sprachaufnahmen, um damit die eigene Spracherkennung Deep Speech und andere Projekte fördern zu können. Erstmals wird Common Voice nun offiziell mehrsprachig.

Artikel veröffentlicht am ,
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig.
Mozilla sammelt frei zugängliche Sprachdaten - jetzt auch mehrsprachig. (Bild: Mozilla, Common Voice/CC-BY-SA 3.0)

Das von Mozilla im vergangenen Jahr gestartete Projekt Common Voice wird mehrsprachig. Das gab der für das Projekt zuständige Michael Henretty bekannt. Mit Common Voice sammelt Mozilla per Crowdsourcing Sprachaufnahmen, die unter einer freien Lizenz bereitgestellt werden. Das Common-Voice-Projekt wird nach Englisch nun auch auf offiziell auf Deutsch, Französisch und Walisisch ausgeweitet.

Stellenmarkt
  1. über duerenhoff GmbH, Raum Offenburg
  2. IMD Institut für Medizinische Diagnostik GmbH, Berlin-Steglitz

Alle, die wollen, können der Sprachdatenbank nun ihre Stimme in diesen Sprachen spenden. Dazu lesen Sprecher von Mozilla und der Community vorbereitete Sätze vor und nehmen sich dabei auf. In einem weiteren Teil des Common-Voice-Projektes werden diese Aufnahmen gesprochener Sprache von anderen Nutzern bewertet beziehungsweise validiert. Mozilla hat eine erste Version des Datensatzes für Englisch bereits unter CC-0-Lizenz veröffentlicht.

Ein wichtiger Teil der Arbeiten zur Unterstützung der Mehrsprachigkeit von Common Voice ist neben offensichtlichen Aufgaben wie der Übersetzung der Webseite vor allem die Auswahl des Vorlesematerials. Wie Henretty im Interview mit Golem.de im vergangenem Jahr sagte, bereitet die Suche nach gemeinfreiem oder CC-0-lizenziertem Material noch Probleme. So nutzen historisch gemeinfreie Werke wie Bücher eine im Gegensatz zu heute klar veraltete Sprache, die so wohl kein Sprecher mehr verwenden würde.

Weitere Sprachen in Vorbereitung

Ziel des Projektes ist es, die Daten als Grundlage für Spracherkennungprojekte und verwandte Techniken zu verwenden, wie etwa für Mozillas Deep Speech, das auch den Anstoß für Common Voice gab. Dem Team ist es dabei besonders wichtig, auch kleinere Sprach- und Sprechergemeinschaften repräsentieren zu können, die von kommerziellen Anbietern solcher Systeme oder Datensätze nicht oder wenig beachtet werden.

Zusätzlich zu den vorgestellten Sprachen arbeitet das Team mit seiner Community bereits daran, mehr als 40 weitere Sprachen als Teil von Common Voice zu unterstützen.



Anzeige
Spiele-Angebote
  1. 49,86€
  2. (-8%) 54,99€
  3. 4,99€
  4. 3,86€

Folgen Sie uns
       


Sechs Bluetooth-Hörstöpsel im Test

Wir haben sechs neue Bluetooth-Hörstöpsel getestet. Mit dabei sind Modelle von Sennheiser, Audio Technica, Master & Dynamic sowie HMD Global. Aber auch zwei Modelle kleinerer Startups sind vertreten. Und eines davon hat uns bezüglich der Akkulaufzeit sehr überrascht. Kein anderer von uns getesteter Bluetooth-Hörstöpsel hat bisher eine vergleichbar lange Akkulaufzeit zu bieten - wir kamen auf Werte von bis zu 11,5 Stunden statt der sonst üblichen drei bis fünf Stunden.

Sechs Bluetooth-Hörstöpsel im Test Video aufrufen
Verschlüsselung: Die meisten Nutzer brauchen kein VPN
Verschlüsselung
Die meisten Nutzer brauchen kein VPN

VPN-Anbieter werben aggressiv und preisen ihre Produkte als Allheilmittel in Sachen Sicherheit an. Doch im modernen Internet nützen sie wenig und bringen oft sogar Gefahren mit sich.
Eine Analyse von Hanno Böck

  1. Security Wireguard-VPN für MacOS erschienen
  2. Security Wireguard-VPN für iOS verfügbar
  3. Outline Digitalocean und Alphabet-Tochter bieten individuelles VPN

Fido-Sticks im Test: Endlich schlechte Passwörter
Fido-Sticks im Test
Endlich schlechte Passwörter

Sicher mit nur einer PIN oder einem schlechten Passwort: Fido-Sticks sollen auf Tastendruck Zwei-Faktor-Authentifizierung oder passwortloses Anmelden ermöglichen. Golem.de hat getestet, ob sie halten, was sie versprechen.
Ein Test von Moritz Tremmel

  1. Datenschutz Facebook speicherte Millionen Passwörter im Klartext
  2. E-Mail-Marketing Datenbank mit 800 Millionen E-Mail-Adressen online
  3. Webauthn Standard für passwortloses Anmelden verabschiedet

Tom Clancy's The Division 2 im Test: Richtig guter Loot-Shooter
Tom Clancy's The Division 2 im Test
Richtig guter Loot-Shooter

Ubisofts neuer Online-Shooter beweist, dass komplexe Live-Spiele durchaus von Anfang an überzeugen können. Bis auf die schwache Geschichte und Gegner, denen selbst Dauerbeschuss kaum etwas anhaben kann, ist The Division 2 ein spektakuläres Spiel.
Von Jan Bojaryn

  1. Netztest Connect Netztest urteilt trotz Funklöchern zweimal sehr gut
  2. Netztest Chip verteilt viel Lob trotz Funklöchern

    •  /