Deep Learning: Echte Gesichter aus KI-Fake-Generatoren identifizierbar

Deep-Learning-Modelle verraten wohl deutlich mehr über ihr Innenleben, als angenommen. Dazu können auch echte Trainingsdaten gehören.

Artikel veröffentlicht am ,
Diese Gesichter sind künstlich erzeugt, könnten aber etwas über die Ausgangsdaten verraten.
Diese Gesichter sind künstlich erzeugt, könnten aber etwas über die Ausgangsdaten verraten. (Bild: Disney/ETH Zürich)

Mithilfe von Webseiten wie This Person Does Not Exist und dazugehörigen Machine-Learning-Modellen sollen sich schnell und leicht Gesichter generieren lassen, die nicht zu echten Personen gehören, sondern allein künstlich erstellt sind. Ein Forschungsteam konnte nun aber zeigen, dass die erzeugten Gesichter gar nicht so künstlich sind, wie erwartet. Das berichtet das Magazin Technology Review.

Stellenmarkt
  1. Ingenieur FH / Bachelor (m/w/d) der Fachrichtung Elektrotechnik, Nachrichtentechnik, Hochfrequenztechnik ... (m/w/d)
    Bayerisches Landeskriminalamt, Königsbrunn
  2. Junior Product-Owner (m/w/d) Software-Entwicklung
    MVZ Martinsried GmbH, Martinsried
Detailsuche

Demnach sehen die erzeugten Gesichter in vielen Fällen jenen Gesichtern sehr ähnlich, deren Aufnahmen als Trainingsdaten für das eigentliche Modell genutzt worden sind. Die falschen Gesichter könnten so echte Identitäten preisgeben. Laut Technology Review sei diese Arbeit eine weiterer wichtiger Beleg dafür, dass Machine-Learning-Modelle doch viel mehr über ihr Innenleben und ihre Ausgangsdaten verraten, als von vielen angenommen.

Im Falle der Gesichter nutzte das Forschungsteam einen sogenannten Membership-Angriff, um herauszufinden, ob und welche Gesichter eventuell in den Trainingsdaten vorhanden sind. Dabei wird ausgenutzt, dass ein Modell jene Daten, mit denen es trainiert worden ist, leicht anders behandelt, als unbekannte Daten. Dem Team gelang es darüber hinaus auch, ähnliche Aufnahmen in den Trainingsdaten zu erkennen, die letztlich zu gleichen Personen gehörten. Dies gelang wiederum über die generierten Gesichter, die dann kaum zufällig waren, sondern vielmehr große Ähnlichkeit mit den Ausgangsdaten aufwiesen.

Datenlecks über weitere Techniken möglich

In einer weiteren Forschungsarbeit, über die Technology Review berichtet, ist es gar gelungen, direkt die Trainingsdaten aus dem Modell selbst wiederherzustellen. Dafür sind die einzelnen Schritte, die das Modell durchläuft, zurückverfolgt und rückwärts angewendet worden. Die so gewonnenen Bilder sehen denen der echten Trainingsdaten sehr ähnlich.

Golem Akademie
  1. Netzwerktechnik Kompaktkurs
    8.-12. November 2021, online
  2. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  3. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
Weitere IT-Trainings

Unabhängig von den konkreten Beispielen gibt die Arbeit einen Anhaltspunkt dafür, dass Ähnliches auch mit anderen produktiv genutzten Modellen möglich sein könnte. Etwa im Falle von medizinischen Daten könnte dies gravierende Folgen für die Betroffenen haben, wenn ihre Identitäten bekannt würden. Ob es möglich ist, diese Art des Datenleaks über die Modelle selbst zu verhindern, bleibt Teil künftiger Forschungsarbeiten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Silence S04
Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt

Beim Elektroauto Silence S04 kann der Nutzer den Akku selbst wechseln, wenn dieser leergefahren ist.

Silence S04: Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt
Artikel
  1. Microsoft: Das nächste große Update für Windows 10 kommt im November
    Microsoft
    Das nächste große Update für Windows 10 kommt im November

    Die Version 21H2 wurde wohl auch wegen Windows 11 etwas nach hinten verschoben. Der Patch soll nun aber im November für Windows 10 kommen.

  2. Arduino und Python: Bastler nimmt Audiokassette als Speichermedium für Retro-PC
    Arduino und Python
    Bastler nimmt Audiokassette als Speichermedium für Retro-PC

    Die Kassette kann nicht nur Lieder speichern, sondern auch Bitmuster. Ein Bastler baut dafür eine Schnittstelle mit 1,5 KBit/s Datenrate.

  3. Bis Ende 2022: VW-Manager müssen wegen Chipkrise Verbrenner fahren
    Bis Ende 2022
    VW-Manager müssen wegen Chipkrise Verbrenner fahren

    2022 werden VWs Manager den Kurs des Unternehmenschefs Herbert Diess nicht fahren können - Elektroautos und Hybride können als Dienstwagen nicht bestellt werden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AOC CQ32G2SE/BK 285,70€ • Dell Alienware AW2521H 360 Hz 499€ • Corsair Vengeance RGB PRO SL 64-GB-Kit 3600 253,64€ • DeepCool Castle 360EX 109,90€ • Phanteks Glacier One 240MP 105,89€ • Seagate SSDs & HDDs günstiger • Alternate (u. a. Thermaltake Core P3 TG Snow Ed. 121,89€) [Werbung]
    •  /