Google: Neuronales Netzwerk übersetzt in ungelernte Sprachen

Google sucht nach einem Weg, sein neuronales Übersetzungsnetzwerk auch für andere Sprachen nutzbar zu machen. Dabei wurde nun ein Weg gefunden, wie weitere Sprachkombinationen übersetzt werden können - auch wenn diese nicht explizit erlernt wurden.

Artikel veröffentlicht am ,
Ein Schema von Googles Übersetzungssystem - Japanisch kann trotz fehlendem Trainings in Koreanisch übersetzt werden.
Ein Schema von Googles Übersetzungssystem - Japanisch kann trotz fehlendem Trainings in Koreanisch übersetzt werden. (Bild: Google)

Wissenschaftler von Google haben einen Weg gefunden, das für die Sprachübersetzung verwendete neuronale Netzwerk so zu verbessern, dass es nicht bekannte Sprachpaare übersetzen kann. Erst vor kurzem hatte Google die ersten acht Sprachpaare bekanntgegeben, die anstelle der bisherigen statistischen Übersetzungsmethoden des Google-Übersetzers ein neuronales Netzwerk verwenden.

Training für 103 Sprachen wäre viel zu aufwendig

Stellenmarkt
  1. Senior Development Engineer (w/m/d) RF Signal Processing
    MBDA Deutschland, Augsburg, Ingolstadt, München
  2. Bankkaufmann / Fachinformatiker als Informationssicherheitsbeauf- tragten (m/w/d)
    Volksbank Mittelhessen eG, Gießen
Detailsuche

Durch dieses System, Google nennt es Google Neural Machine Translation (GNMT), sind qualitativ bessere Übersetzungen möglich. Die Schwierigkeit besteht darin, das vorhandene System ohne ausuferndes Training für alle 103 vom Google-Übersetzer unterstützten Sprachen verfügbar zu machen. Auf dem Weg zu einer Lösung dieses Problems haben die Google-Wissenschaftler das GNMT-System leicht modifiziert und mit einem Token ausgestattet.

Dieser markiert den eingegebenen Text mit einer Art Marker, der die Ausgabesprache bestimmt. Der Rest des Modells entspricht dem jetzigen GNMT-System ohne zusätzliche Erweiterungen, Trainings für neue Sprachen sollen nicht nötig sein. Auf diese Weise soll das neuronale Netzwerk schnell lernen, in andere Sprachen zu übersetzen.

Übersetzungen in untrainierte Sprachen sind möglich

Ein derartiges System erlaubt sogenannte "Zero-Shot"-Übersetzungen, also Übersetzungen zwischen Sprachen, die dem System eigentlich nicht angelernt wurden. Das Wissen, wie das GNMT beispielsweise Koreanisch in Japanisch übersetzen kann, holt es sich aus seinem Training in der Übersetzung von Englisch in Japanisch und Englisch in Koreanisch.

Golem Karrierewelt
  1. Kubernetes – das Container Orchestration Framework: virtueller Vier-Tage-Workshop
    20.-23.02.2023, Virtuell
  2. C++ Programmierung Grundlagen (keine Vorkenntnisse benötigt): virtueller Drei-Tage-Workshop
    16.-18.01.2023, virtuell
Weitere IT-Trainings

Dabei haben die Google-Wissenschaftler sich gefragt, wie das neuronale Netzwerk dieses Übersetzungswissen teilt. Im konkreten Beispiel mit den Sprachen Koreanisch, Japanisch und Englisch haben sie herausgefunden, dass die übersetzten Sätze in Gruppen nach Bedeutung zusammengefasst werden. Daraus schließen die Wissenschaftler, dass das System die semantischen Zusammenhänge erkennt, und nicht nur bloße Wörter zuordnet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


spitfire_ch 25. Nov 2016

Aus "Versuchskaninchen": Picard: "Und wenn Du meinst, Du könntest hier ausrasten, dann...

Vielfalt 25. Nov 2016

Wo ist die News?

William 24. Nov 2016

Danke ! Werde ich mir mal durch lesen bzw. anschauen. :)

theonlyone 24. Nov 2016

Naja das Ding ist ja, das man auch ohne eine "Zwischensprache" jede Sprache in die andere...



Aktuell auf der Startseite von Golem.de
Urheberrechtsverletzung
US-Marine muss Strafe an deutsche Firma bezahlen

Noch während der Lizenzverhandlungen installierte die US-Marine eine Software auf über 500.000 Rechnern. Sechs Jahre später muss sie dafür bezahlen.

Urheberrechtsverletzung: US-Marine muss Strafe an deutsche Firma bezahlen
Artikel
  1. Karmesin und Purpur: Nintendo entschuldigt sich für Probleme mit Pokémon
    Karmesin und Purpur
    Nintendo entschuldigt sich für Probleme mit Pokémon

    Schwache Grafik und trotzdem Ruckler: Viele Spieler ärgern sich über den technischen Zustand von Pokémon Karmesin/Purpur.

  2. Bayern: Arbeitszeit von mehr als 10 Stunden am Tag gefordert
    Bayern
    Arbeitszeit von mehr als 10 Stunden am Tag gefordert

    Die bayerische Arbeitsministerin plädiert für mehr Flexibilität am Arbeitsplatz und will mehr als zehn Stunden Arbeit pro Tag erlauben.

  3. EuGH: Google legt erneut Einspruch gegen Milliardenstrafe ein
    EuGH
    Google legt erneut Einspruch gegen Milliardenstrafe ein

    Google will keine 4,125 Milliarden Euro zahlen und zieht mit dem Fall vor den Europäischen Gerichthof. Es geht um Android.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 jetzt bestellbar • LG OLED TV (2022) 55" 120Hz 949€ • Mindstar: Geforce RTX 4080 1.449€ • Tiefstpreise: G.Skill 32GB Kitt DDR5-7200 • 351,99€ Crucial SSD 4TB 319€, HTC Vive Pro 2 659€ • Samsung Cyber Week • Top-TVs (2022) LG & Samsung über 40% günstiger [Werbung]
    •  /