StyleGAN2: Experiment zeigt, wie echt KI-generierte Gesichter wirken

In einem Experiment wollte ein Forschungsteam der Association for Psychological Science (APS) wissen, wie schwer sich KI-generierte Gesichter von echten menschlichen Fotos unterscheiden lassen. Das Ergebnis(öffnet im neuen Fenster) ist überraschend: KI-generierte Gesichter scheinen von den echten Gesichtern nicht unterscheidbar zu sein.
Die Daten suggerieren sogar, dass KI-generierte Bilder öfter als menschlich eingeschätzt wurden. In 65,9 Prozent der Fälle wurden sie für Menschen gehalten. Verglichen damit erscheinen die wirklichen menschlichen Gesichter weniger echt. Diese wurden in 51,1 Prozent der Fälle richtig erkannt - nur wenig mehr als die 50-Prozent-Chance beim simplen Raten. Allerdings unterliegt das Experiment einigen Einschränkungen.
So wurden erst einmal nur Gesichter genutzt, die theoretisch als Menschen mit weißer Hautfarbe identifiziert werden können. Entsprechend wurden als Testgruppen auch nur weiße Menschen ausgewählt, die zwischen KI- und Echtbildern unterscheiden sollen. Damit sollen diverse Variablen eliminiert werden, die das Ergebnis verfälschen können. Die Annahme ist es, dass Gesichter anderer Kulturen für verschiedene Ethnien übermäßig herausstechen können.
Das Experiment ist zudem aus mehreren Gründen nicht allgemein anwendbar. Die Testgruppe, die für die finalen Ergebnisse sorgte, bestand aus 124 Personen - 61 Männer, 62 Frauen und eine diverse Person. Alle Teilnehmer stammen aus den USA und lebten nicht länger als zwei Jahre lang in einem anderen Land.
KI-generiert mit StyleGAN2
Für das Generieren der Bilder wurde Nvidias neuronales Netzwerk StyleGAN 2(öffnet im neuen Fenster) verwendet. Es generiert Bilder von realistisch anmutenden Gesichtern. Die echten Fotos stammen aus dem KI-Quelldatenset Flickr-Faces-HQ. Anschließend wurden die von der KI erzeugten Gesichter von Menschen auf Artefakte überprüft und diese bereinigt - beispielsweise offensichtliche doppelt generierte Gesichter im Hintergrund. Die kleine Studie macht also nicht unbedingt eine Aussage für den technischen Stand aktueller Bildgeneratoren.
Die Teilnehmer sollten sich die Bilder aus einer Entfernung von 50 cm und einem Winkel von 12 Grad anschauen und sie auf Basis ihrer Beobachtungen einstufen. Vor allem die Bildqualität, also Farbgebung, Rendering-Artefakte oder offensichtliche Bearbeitungsfehler, sowie spezifische Gesichtsmerkmale wie Augen, Ohren, Hals und Zähne, wurden dabei genutzt, um zwischen echten und erstellten Fotos zu unterscheiden.
In einem zweiten Experiment sollte eine zweite Testgruppe aus 610 Personen (290 Männer, 312 Frauen, 8 divers) die Bilder auf einer Skala von 0 bis 100 nach bestimmten Kriterien bewerten und einschätzen, ob es sich um ein menschliches oder künstlich erstelltes Gesicht handelt. Die Kriterien umfassen etwa Alter, Gesichtssymmetrie, Attraktivität und Aussagekraft eines Gesichts. Auf Basis dieser Werte erstellte das Team einen Klassifikator, der die mittels StyleGAN2 erstellten KI-Gesichter erkennen sollte. Das klappt recht gut: Die Software konnte 95 Prozent der menschlichen und 93 Prozent der KI-Gesichter auch als solche erkennen.
Die Ergebnisse und Methodik der Untersuchung wurden im Internet veröffentlicht(öffnet im neuen Fenster) .
Weitere Informationen zum Thema künstliche Intelligenz gibt es hier in unserem Karriere-Ratgeber.



