• IT-Karriere:
  • Services:

Translatotron: Google übersetzt Sprachaufnahmen direkt in andere Sprache

Um gesprochene Sprache zu übersetzen, wird bisher ein Ansatz mit mehreren Zwischenschritten angewendet. Mit dem Translatotron will Google die Übersetzung nun direkt durchführen.

Artikel veröffentlicht am ,
Google versucht sich an der Zukunft der automatischen Sprachübersetzung.
Google versucht sich an der Zukunft der automatischen Sprachübersetzung. (Bild: Todd van Hoosear/CC-BY-SA 2.0)

Ideen wie der Babelfisch aus Per Anhalter durch die Galaxis oder der Universalübersetzer aus Star Trek erscheinen dank der Arbeit verschiedener IT-Unternehmen an Übersetzungswerkzeugen inzwischen zumindest teilweise als erreichbar. Google hat mit Translatotron ein Modell zur direkten Übersetzung von Sprachaufnahmen in andere Sprachen vorgestellt, das auf die bisherigen Zwischenschritte verzichtet.

Stellenmarkt
  1. ASB Informationstechnik GmbH, Duisburg
  2. HxGN Safety & Infrastructure GmbH, Bonn

Das Vorgehen zur Übersetzung gesprochener Sprache geschieht derzeit oft durch die Aneinanderreihung mehrerer Machine-Learning-Modelle, die nacheinander ausgeführt werden. So wird zuerst Sprache in Text umgewandelt, dieser Text wiederum als Text übersetzt und letztlich wieder zurück in gesprochene Sprache überführt.

Mit Translatotron hingegen wird eine Sprachaufnahme direkt in Sprache überführt. Google nutzt dazu ein Sequence-to-Sequence-Modell, also eine Vorgehensweise, die Forscher des Unternehmens selbst vor einigen Jahren geprägt haben. Übersetzt werden von dem System dabei genaugenommen Spektrogramme. Ein Vocoder sorgt dann noch für die Spracherzeugung. Zusätzlich hat das Team einen sogenannten Speaker Encoder getestet, um die synthetisierte Stimme möglichst nah an der des Sprechers auszurichten. Für das Training des Modells greift Translatotron außerdem auf eine Textrepräsentation zurück, für das Inferencing, also die eigentliche Übersetzung, wird aber kein Text mehr genutzt.

Noch schneidet die Nutzung der direkten Sprachübersetzung in Translatotron deutlich schlechter ab, als die bisher genutzten konventionellen Systeme. Das Team von Google gibt sich dennoch zufrieden und bezeichnet das System als erfolgreiche Machbarkeitsstudie. Wer sich für die Ergebnisse der Übersetzungen interessiert, kann sich an einigen Beispielen selbst ein Bild von den Fähigkeiten des Translatotron machen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. (u. a. F1 2019 Anniversary Edition für 26,99€, Jurassic World Evolution Deluxe Edition für 15...
  2. (-60%) 23,99€
  3. 4,32€
  4. (-28%) 17,99€

quineloe 28. Mai 2019

Bezahlt ihr auch dafür? Sieht ja so aus, als hätte das weniger features als google in der...

AllDayPiano 16. Mai 2019

0:00 wird angezeigt. Schade.


Folgen Sie uns
       


55-Zoll-OLED-Monitor von Alienware - Test

Mit 120 Hz, 4K-Auflösung und 55-Zoll-Panel ist der AW5520qf ein riesiger Gaming-Monitor. Darauf macht es besonders Spaß, Monster in Borderlands 3 zu besiegen. Wäre da nicht die ziemlich niedrige Ausleuchtung.

55-Zoll-OLED-Monitor von Alienware - Test Video aufrufen
Deep Fakes: Hello, Adele - bist du's wirklich?
Deep Fakes
Hello, Adele - bist du's wirklich?

Mit Deep Fakes wird geblödelt, gehetzt und geputscht. Bedrohen Videos, die vorgaukeln, Stars und Politiker zu zeigen, die Demokratie? Möglich, nur anders, als wir denken.
Eine Analyse von Meike Laaff

  1. Machine Learning Kalifornien will gegen Deep-Fake-Pornografie vorgehen
  2. Machine Learning Tensorflow 2.0 macht Keras-API zum zentralen Bestandteil
  3. Neural Structured Learning Tensorflow lernt auf Graphen und strukturierten Daten

Macbook Pro 16 Zoll im Test: Ein Schritt zurück sind zwei Schritte nach vorn
Macbook Pro 16 Zoll im Test
Ein Schritt zurück sind zwei Schritte nach vorn

Keine Butterfly-Tastatur mehr, eine physische Escape-Taste, dünnere Displayränder: Es scheint, als habe Apple beim Macbook Pro 16 doch auf das Feedback der Nutzer gehört und ist einen Schritt zurückgegangen. Golem.de hat sich angeschaut, ob sich die Änderungen auch lohnen.
Ein Test von Oliver Nickel

  1. Audioprobleme Knackgeräusche beim neuen Macbook Pro 16 Zoll
  2. iFixit Kleber und Nieten im neuen Macbook Pro 16 Zoll
  3. Macbook Pro Apple gibt fehlerhafte Butterfly-Tastatur auf

Mikrocontroller: Sensordaten mit Micro Python und ESP8266 auslesen
Mikrocontroller
Sensordaten mit Micro Python und ESP8266 auslesen

Python gilt als relativ einfach und ist die Sprache der Wahl in der Data Science und beim maschinellen Lernen. Aber die Sprache kann auch anders. Mithilfe von Micro Python können zum Beispiel Sensordaten ausgelesen werden. Ein kleines Elektronikprojekt ganz ohne Löten.
Eine Anleitung von Dirk Koller

  1. Programmiersprache Python verkürzt Release-Zyklus auf ein Jahr
  2. Programmiersprache Anfang 2020 ist endgültig Schluss für Python 2
  3. Micropython Das Pyboard D ist ein Steckbausatz für IoT-Bastler

    •  /