Machine Learning: Forscher halten Google-Übersetzer für sexistisch

Ein Forscherteam der brasilianischen staatlichen Universität in Porto Alegre (Universidade Federal do Rio Grande do Sul) hat den kostenlos verfügbaren Maschinenübersetzer Google Translate untersucht(öffnet im neuen Fenster) (PDF) und für sexistisch befunden. Um dies herauszubekommen, haben die Forscher einfache Sätze in verschiedenen Sprachen ins Englische übersetzt. Dazu nutzten sie Sprachen, die keinen geschlechterspezifischen Personalpronomen wie "er" oder "sie" verwenden: etwa Ungarisch, Türkisch, Japanisch und Chinesisch.
Bereits einfache Ergebnisse scheinen dabei eindeutig zu sein: Das ungarische "Õ egy ápoló" übersetzt Google Translate mit: "Sie ist eine Krankenschwester" . "Õ egy mérnök" wird hingegen als "Er ist ein Ingenieur" übersetzt. Ähnliche Ergebnisse erzielten Begriffe wie "der Geschäftsführer" und "die Bäckerin". Als Schluss daraus ziehen die Forscher, dass das Übersetzungssystem bestimmte Begriffe mit bestimmten Geschlechtern ungewöhnlich oft assoziiert. Das gelte übrigens auch für diverse Adjektive: Wörter wie attraktiv, schüchtern, fröhlich und freundlich werden vom Übersetzer eher mit Frauen verbunden. Arrogant, grausam und schuldig bringt die Software wohl mit Männern in Verbindung.
Übersetzer soll zumindest die Gesellschaft widerspiegeln
Die Forscher gestehen ein, dass ein aus gesellschaftlichen Texten und Inhalten trainierter Übersetzer wie Google Translate immer zumindest in soweit vorurteilsbehaftet ist, dass er unsere Gesellschaft widerspiegelt. Allerdings sei die Software im Wesentlichen sexistischer als die Realität. Über alle untersuchten Berufe und Sprachen verteilt sei das Team nur zu knapp 12 Prozent auf weibliche Artikel gestoßen, während in der echten Welt global verteilt knapp 36 Prozent aller Arbeitnehmer Frauen seien.
Das Machine-Learning-System des Google-Übersetzers basiert zu Teilen auf Texten im Internet. Quellen wie Wikipedia werden zu einem sehr großen Anteil von Männern mit Inhalten befüllt. Eine bereits ältere Studie(öffnet im neuen Fenster) des Portals spricht von einem Männeranteil von 90 Prozent. Der Google-Übersetzer ist aber ständig diversen Änderungen ausgesetzt: Ein kurzer Test(öffnet im neuen Fenster) bestätigt, dass das Team hinter dem kostenlosen Übersetzungstool sich Kritik wie diese zu Herzen nimmt. So ergibt "Õ egy ápoló" mittlerweile auch: "Er ist ein Krankenpfleger" .