Zum Hauptinhalt Zur Navigation

Maschinelles Lernen: Googles KI schreibt schlechte Liebesgedichte

Mit maschinellem Lernen will Google sinnvolle Dialoge erzeugen. Als Trainingsdaten dienen dafür unter anderem Liebesromane. Das Ergebnis erinnert aber teils mehr an absurde Gedichte als an schmachtende Texte.
/ Sebastian Grüner
29 Kommentare News folgen (öffnet im neuen Fenster)
Die Forschungsabteilung von Google versucht sich jetzt auch an Romantik - rein wisschenschaftlich natürlich. (Bild: flickr.com, josh.greentee)
Die Forschungsabteilung von Google versucht sich jetzt auch an Romantik - rein wisschenschaftlich natürlich. Bild: flickr.com, josh.greentee / CC-BY-SA 2.0

Einzelne Sätze und deren Aufbau verstehen, das können Maschinen inzwischen schon sehr gut, wie Google erst vergangene Woche mit seinem Englisch-Parser Parsey McParseface bewiesen hat. Satzübergreifend Zusammenhänge in Dialogen zu erkennen oder sinnvolle Dialoge gar selbst zu erzeugen, scheint dagegen noch extrem schwierig zu sein, was die Forschungsabteilung von Google nun in einer Untersuchung(öffnet im neuen Fenster) zeigt.

Mit Hilfe eines neuen Modells versuchen die Forscher, Sätze nicht einfach nur wortweise aufzubauen, sondern über "ganzheitliche Eigenschaften von Sätzen wie Stil, Topik oder höherklassige syntaktische Funktionen" . Zum Trainieren des Modells wird ein vergleichsweise großer Textkorpus verwendet, der hauptsächlich aus fiktionalen Texten besteht. Darunter sind auch einige tausend Liebesromane(öffnet im neuen Fenster) .

Korrekte Sätze sind nicht gut genug

Das Modell ist dabei darauf ausgerichtet, ähnliche oder auch gleichartige Sätze in Bezug auf die genannten Eigenschaften in der Trainingsphase möglichst gut zu erkennen. Für die letztlich gewünschte Produktion soll so auch die wichtige Variation natürlicher Sprache generiert werden. In den vorgestellten Beispielen werden so die Übergänge zwischen einem vorgegebenen Anfang und Ende eines Dialoges erzeugt.

Der zumindest theoretisch wichtige Erfolg dieser Herangehensweise ist, dass die so erstellten Zwischensätze "fast immer grammatisch sind, und das Topik, Vokabular und syntaktische Informationen von Sätzen in lokaler Nachbarschaft oft konsistent sind" . Doch selbst an die meist eher einfache Sprache von Liebesromanen reichen die Ergebnisse nur selten heran. Die veröffentlichten Dialoge erinnern vielmehr an absurde Gedichte oder postmoderne Experimente, so etwa folgender:

no.
he said.
" no , " he said.
" no , " i said.
" i know , " she said.
" thank you , " she said.
" come with me , " she said.
" talk to me , " she said.
"don't worry about it , " she said.

Andere Dialoge sind aber tatsächlich besser und ergeben ein wenig mehr Sinn wie dieser:

there is no one else in the world.
there is no one else in sight.
they were the only ones who mattered.
they were the only ones left.
he had to be with me.
she had to be with him.
i had to do this.
i wanted to kill him.
i started to cry.
i turned to him.


Relevante Themen