Facebook: Neuronales Netzwerk wandelt Sprache in andere Sprachen um
Facebook-Forscher arbeiten an einem Programm, das die Toneigenschaften von Sprachen lernt und Gesprochenes in andere Sprachen umwandeln kann. Erste Ergebnisse klingen schon relativ glaubwürdig. Allerdings gibt es Einschränkungen.

Facebook entwickelt ein Neuronales Netzwerk (PDF), welches die Sprachmelodie einer Sprache in eine andere Sprache umwandeln kann. Es übersetzt im Prinzip das Gesprochene einer Person und behält den Klang der Stimme bei. Bisher versteht das System drei verschiedene Sprachen: Englisch, Spanisch und Deutsch. Es handelt sich dabei ausschließlich um ein Text-to-Speech-System (TTS). Es übersetzt keinen Text.
Die Wissenschaftler nutzen die Klangeigenschaften jeder der drei Sprachen, um diese auseinanderzuhalten. Als zweites Element wird der Software ein zu sprechender Text übergeben. Das neuronale Netzwerk setzt die Phonetik und den Text zu einem Ergebnis zusammen. Die Grundlage für die Tonbeispiele bilden 109 englischsprachige, 100 spanischsprachige und 201 deutschsprachige Personen. Aus diesen haben die Forscher ihre Tonwörterbücher erstellt.
Ergebnisse noch nicht perfekt
Das Ergebnis: Die Übersetzung in das Englische kommt einer Jury aus zehn Menschen am natürlichsten vor. Auf einer Skala von 0 bis 5 wurde dies mit durchschnittlich 3,4 bewertet. Das Umwandeln ins Spanische oder Deutsche wird als unnatürlicher wahrgenommen. Das liegt daran, dass dem neuronalen Netzwerk 40.000 englischsprachige und nur 5.500 spanische und 15.000 deutschsprachige Sprachbeispiele als Lerngrundlage zur Verfügung gestellt wurden.
Das US-Onlinemagazin Venturebeat stellt zwei verschiedene Ergebnisse bereit, bei denen der Satz "The rainbow is the division of white" aus dem Spanischen und aus dem Deutschen umgewandelt wurde. Ersteres Ergebnis klingt interessanterweise so, wie viele deutschsprachige Personen Englisch sprechen würden. Es ist ein klarer Akkzent zu hören. Der spanischsprachigen Stimme hat die Software stattdessen am Ende des Satzes undefinierbare Töne angehängt.
Das System ist also bei weitem noch nicht perfekt. Es könnte zusammen mit Übersetzungssoftware in einigen Jahren aber etwa als mobiler Übersetzer dienen, der in Echtzeit die eigene Stimme übersetzt.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Ich habe mich schon lange gefragt, wie lang es dauert bis jemand mal in die Richtung...