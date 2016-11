Wissenschaftler von Google haben einen Weg gefunden, das für die Sprachübersetzung verwendete neuronale Netzwerk so zu verbessern, dass es nicht bekannte Sprachpaare übersetzen kann. Erst vor kurzem hatte Google die ersten acht Sprachpaare bekanntgegeben, die anstelle der bisherigen statistischen Übersetzungsmethoden des Google-Übersetzers ein neuronales Netzwerk verwenden.

Training für 103 Sprachen wäre viel zu aufwendig

Durch dieses System, Google nennt es Google Neural Machine Translation (GNMT), sind qualitativ bessere Übersetzungen möglich. Die Schwierigkeit besteht darin, das vorhandene System ohne ausuferndes Training für alle 103 vom Google-Übersetzer unterstützten Sprachen verfügbar zu machen. Auf dem Weg zu einer Lösung dieses Problems haben die Google-Wissenschaftler das GNMT-System leicht modifiziert und mit einem Token ausgestattet.

Dieser markiert den eingegebenen Text mit einer Art Marker, der die Ausgabesprache bestimmt. Der Rest des Modells entspricht dem jetzigen GNMT-System ohne zusätzliche Erweiterungen, Trainings für neue Sprachen sollen nicht nötig sein. Auf diese Weise soll das neuronale Netzwerk schnell lernen, in andere Sprachen zu übersetzen.

Übersetzungen in untrainierte Sprachen sind möglich

Ein derartiges System erlaubt sogenannte "Zero-Shot"-Übersetzungen, also Übersetzungen zwischen Sprachen, die dem System eigentlich nicht angelernt wurden. Das Wissen, wie das GNMT beispielsweise Koreanisch in Japanisch übersetzen kann, holt es sich aus seinem Training in der Übersetzung von Englisch in Japanisch und Englisch in Koreanisch.

Dabei haben die Google-Wissenschaftler sich gefragt, wie das neuronale Netzwerk dieses Übersetzungswissen teilt. Im konkreten Beispiel mit den Sprachen Koreanisch, Japanisch und Englisch haben sie herausgefunden, dass die übersetzten Sätze in Gruppen nach Bedeutung zusammengefasst werden. Daraus schließen die Wissenschaftler, dass das System die semantischen Zusammenhänge erkennt, und nicht nur bloße Wörter zuordnet.