Deep Learning: Echte Gesichter aus KI-Fake-Generatoren identifizierbar

Deep-Learning-Modelle verraten wohl deutlich mehr über ihr Innenleben, als angenommen. Dazu können auch echte Trainingsdaten gehören.

Artikel veröffentlicht am ,
Diese Gesichter sind künstlich erzeugt, könnten aber etwas über die Ausgangsdaten verraten.
Diese Gesichter sind künstlich erzeugt, könnten aber etwas über die Ausgangsdaten verraten. (Bild: Disney/ETH Zürich)

Mithilfe von Webseiten wie This Person Does Not Exist und dazugehörigen Machine-Learning-Modellen sollen sich schnell und leicht Gesichter generieren lassen, die nicht zu echten Personen gehören, sondern allein künstlich erstellt sind. Ein Forschungsteam konnte nun aber zeigen, dass die erzeugten Gesichter gar nicht so künstlich sind, wie erwartet. Das berichtet das Magazin Technology Review.

Stellenmarkt
  1. Automotive Test Lab Engineer - Connected Infotainment (m/w/d)
    operational services GmbH & Co. KG, Ingolstadt
  2. Information Security Experts (m/w/d)
    Allianz ONE - Business Solutions GmbH, Unterföhring, Stuttgart
Detailsuche

Demnach sehen die erzeugten Gesichter in vielen Fällen jenen Gesichtern sehr ähnlich, deren Aufnahmen als Trainingsdaten für das eigentliche Modell genutzt worden sind. Die falschen Gesichter könnten so echte Identitäten preisgeben. Laut Technology Review sei diese Arbeit eine weiterer wichtiger Beleg dafür, dass Machine-Learning-Modelle doch viel mehr über ihr Innenleben und ihre Ausgangsdaten verraten, als von vielen angenommen.

Im Falle der Gesichter nutzte das Forschungsteam einen sogenannten Membership-Angriff, um herauszufinden, ob und welche Gesichter eventuell in den Trainingsdaten vorhanden sind. Dabei wird ausgenutzt, dass ein Modell jene Daten, mit denen es trainiert worden ist, leicht anders behandelt, als unbekannte Daten. Dem Team gelang es darüber hinaus auch, ähnliche Aufnahmen in den Trainingsdaten zu erkennen, die letztlich zu gleichen Personen gehörten. Dies gelang wiederum über die generierten Gesichter, die dann kaum zufällig waren, sondern vielmehr große Ähnlichkeit mit den Ausgangsdaten aufwiesen.

Datenlecks über weitere Techniken möglich

In einer weiteren Forschungsarbeit, über die Technology Review berichtet, ist es gar gelungen, direkt die Trainingsdaten aus dem Modell selbst wiederherzustellen. Dafür sind die einzelnen Schritte, die das Modell durchläuft, zurückverfolgt und rückwärts angewendet worden. Die so gewonnenen Bilder sehen denen der echten Trainingsdaten sehr ähnlich.

Golem Karrierewelt
  1. Advanced Python – Fortgeschrittene Programmierthemen: virtueller Drei-Tage-Workshop
    23.-25.01.2023, Virtuell
  2. Adobe Photoshop Aufbaukurs: virtueller Zwei-Tage-Workshop
    06./07.10.2022, Virtuell
Weitere IT-Trainings

Unabhängig von den konkreten Beispielen gibt die Arbeit einen Anhaltspunkt dafür, dass Ähnliches auch mit anderen produktiv genutzten Modellen möglich sein könnte. Etwa im Falle von medizinischen Daten könnte dies gravierende Folgen für die Betroffenen haben, wenn ihre Identitäten bekannt würden. Ob es möglich ist, diese Art des Datenleaks über die Modelle selbst zu verhindern, bleibt Teil künftiger Forschungsarbeiten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Streit mit Magnus Carlsen
Schachgroßmeister Niemann soll über 100 Mal betrogen haben

Schachweltmeister Magnus Carlsen wirft dem Großmeister Hans Niemann Betrug vor - eine neue Untersuchung stärkt die Vorwürfe.

Streit mit Magnus Carlsen: Schachgroßmeister Niemann soll über 100 Mal betrogen haben
Artikel
  1. Airpods Pro 2 im Test: Apple schaltet Lärm und Konkurrenz aus
    Airpods Pro 2 im Test
    Apple schaltet Lärm und Konkurrenz aus

    Mit sinnvollen Änderungen sind die Airpods Pro 2 das Beste, was es derzeit an ANC-Hörstöpseln gibt. Aber Apples kundenfeindliche Borniertheit nervt.
    Ein Test von Ingo Pakalski

  2. Vodafone und Telekom: Zwei Netzbetreiber melden Datenrekord auf Oktoberfest
    Vodafone und Telekom
    Zwei Netzbetreiber melden Datenrekord auf Oktoberfest

    Die Telekom liegt beim Datenvolumen klar vor Vodafone. Es gab in diesem Jahr besonders viel Roaming durch ausländische Netze.

  3. Dr. Mike Eissele: Es kann immer wieder technologische Revolutionen geben
    Dr. Mike Eissele
    "Es kann immer wieder technologische Revolutionen geben"

    Chefs von Devs Teamviewer-CTO Dr. Mike Eissele gibt einen tiefen Einblick, wie man sich auf eine Arbeitswelt ohne Bildschirme vorbereitet.
    Ein Interview von Daniel Ziegener

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Günstig wie nie: Inno3D RTX 3090 Ti 1.199€, MSI B550 Mainboard 118,10€, LG OLED 48" 799€, Samsung QLED TVs 2022 (u. a. 65" 899€, 55" 657€) • Alternate (Acer Gaming-Monitore) • MindStar (G-Skill DDR4-3600 16GB 88€, Intel Core i5 2.90 Ghz 99€) • 3 Spiele für 49€ [Werbung]
    •  /