Translatotron: Google übersetzt Sprachaufnahmen direkt in andere Sprache
Um gesprochene Sprache zu übersetzen, wird bisher ein Ansatz mit mehreren Zwischenschritten angewendet. Mit dem Translatotron will Google die Übersetzung nun direkt durchführen.

Ideen wie der Babelfisch aus Per Anhalter durch die Galaxis oder der Universalübersetzer aus Star Trek erscheinen dank der Arbeit verschiedener IT-Unternehmen an Übersetzungswerkzeugen inzwischen zumindest teilweise als erreichbar. Google hat mit Translatotron ein Modell zur direkten Übersetzung von Sprachaufnahmen in andere Sprachen vorgestellt, das auf die bisherigen Zwischenschritte verzichtet.
Das Vorgehen zur Übersetzung gesprochener Sprache geschieht derzeit oft durch die Aneinanderreihung mehrerer Machine-Learning-Modelle, die nacheinander ausgeführt werden. So wird zuerst Sprache in Text umgewandelt, dieser Text wiederum als Text übersetzt und letztlich wieder zurück in gesprochene Sprache überführt.
Mit Translatotron hingegen wird eine Sprachaufnahme direkt in Sprache überführt. Google nutzt dazu ein Sequence-to-Sequence-Modell, also eine Vorgehensweise, die Forscher des Unternehmens selbst vor einigen Jahren geprägt haben. Übersetzt werden von dem System dabei genaugenommen Spektrogramme. Ein Vocoder sorgt dann noch für die Spracherzeugung. Zusätzlich hat das Team einen sogenannten Speaker Encoder getestet, um die synthetisierte Stimme möglichst nah an der des Sprechers auszurichten. Für das Training des Modells greift Translatotron außerdem auf eine Textrepräsentation zurück, für das Inferencing, also die eigentliche Übersetzung, wird aber kein Text mehr genutzt.
Noch schneidet die Nutzung der direkten Sprachübersetzung in Translatotron deutlich schlechter ab, als die bisher genutzten konventionellen Systeme. Das Team von Google gibt sich dennoch zufrieden und bezeichnet das System als erfolgreiche Machbarkeitsstudie. Wer sich für die Ergebnisse der Übersetzungen interessiert, kann sich an einigen Beispielen selbst ein Bild von den Fähigkeiten des Translatotron machen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Bezahlt ihr auch dafür? Sieht ja so aus, als hätte das weniger features als google in der...
0:00 wird angezeigt. Schade.