Neuronale Netzwerke: KI-Forscher erwecken die Mona Lisa zum Leben

In Kooperation mit Samsung stellen Forscher eine Software vor, die mit möglichst wenigen Quellbildern Gesichter auf andere Gesichter in Videoclips übertragen kann. Das funktioniert bei echten Menschen und Gemälden - und lässt etwa die Mona Lisa zu einer sprechenden Person werden.

Artikel veröffentlicht am ,
Die Mona Lisa kann durch Software sprechen.
Die Mona Lisa kann durch Software sprechen. (Bild: Egor Zakharov)

Forscher haben ein neuronales Netzwerk vorgestellt, das Gesichter und Gesichtsbewegungen auf andere Personen in Videoclips übertragen kann. In einer Präsentation erweckte das Team so beispielsweise Leonardo da Vincis Mona Lisa zum Leben. Interessant: Das eigentlich zweidimensionale Bild wird mit der Software in verschiedenen Perspektiven gerendert. Zusätzliche Informationen erstellt das System aus eigenen Lerndaten heraus. Veröffentlicht und dokumentiert wird das Projekt auf arxiv.org (PDF) von Samsung AI Center.

Obwohl die Idee an sich nicht neu ist, wie das Einmannprojekt Deep Fakes beweist, ist der Vorteil des fertig trainierten Modells, dass mit Hilfe von möglichst wenigen Beispielbildern Ergebnisse erzeugt werden können. In der Youtube-Präsentation funktioniert das bereits bei einem einzelnen Bild, auch wenn weitere Daten - im Beispiel 16 Motive derselben Person - das Ergebnis sichtbar verbessern.

Training braucht viele Daten

Das Modell erstellt dabei ein abstraktes Modell des Gesichtes, das die für Menschen wichtigsten Elemente enthält. Dazu zählen die generelle Gesichtsform, der Mund, die Nase, die Augen und Augenbrauenbewegungen. Auf Basis dieser wenigen Daten wird eine Gesichtstextur auf ein anderes Gesicht gerendert. Das Ergebnis sieht bereits recht überzeugend aus, was besonders auf Kunstwerke wie die erwähnte Mona Lisa zutrifft. Einige Verzerrungen und Artefakte fallen dort nicht ganz so stark auf, wie es noch bei Aufnahmen von echten Personen der Fall ist.

Das Adversial Neural Network besteht aus zwei Systemen. Das eine prüft die Ergebnisse des anderen auf Authentizität und gibt eine Einschätzung und Feedback zurück. Basierend darauf passt das generierende Modell seine Parameter an, bis das Ergebnis für das prüfende System überzeugend ist. In dieser Lernphase reichen allerdings keine acht Beispielbilder aus. Stattdessen nutzen die Forscher den Videodatensatz Voxceleb2 mit 6.000 verschiedenen Sprechern, die mehr als eine Millionen Samples stellen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Salzbretzel 26. Mai 2019

Zu den Warum - stell dir vor das du eine tolle Filmidee hast. Du schreibst das Drehbuch...

gfa-g 25. Mai 2019

Sieht sehr unnatürlich aus. Man erkennt die anderen Gesichter die für die...

RedRanger 24. Mai 2019

Für mich sieht es aus, als hätte die KI nicht so ganz die Person vom Hintergrund trennen...



Aktuell auf der Startseite von Golem.de
Vision Pro
Apples Mixed-Reality-Taucherbrille kostet 3.500 US-Dollar

Apples erstes Headset kann AR- und VR-Inhalte stufenlos überblenden, hat eine Hand- und Augensteuerung und einen externen Akku.

Vision Pro: Apples Mixed-Reality-Taucherbrille kostet 3.500 US-Dollar
Artikel
  1. iOS 17: Apples iOS 17 bekommt Nachttischmodus und smarte Funktionen
    iOS 17
    Apples iOS 17 bekommt Nachttischmodus und smarte Funktionen

    Apples neues iOS 17 bringt Verbesserungen für Basis-Apps wie Telefon oder Facetime und bringt einen Weckermodus für den Nachttisch.

  2. Macbook Air 15: Apple bringt das Macbook Air in groß
    Macbook Air 15
    Apple bringt das Macbook Air in groß

    Mit 15,3-Zoll-Panel soll das Macbook Air 15 mehr Platz auf dem Desktop haben. Außerdem senkt Apple das 13-Zoll-Modell im Preis.

  3. KI-Texte erkennen: Wer hat's geschrieben, Mensch oder Maschine?
    KI-Texte erkennen
    Wer hat's geschrieben, Mensch oder Maschine?

    Modelle wie ChatGPT sind so gut, dass sich KI- und Menschen-Texte kaum unterscheiden lassen. Forscher arbeiten nun an Verfahren, die sich nicht täuschen lassen.
    Ein Deep Dive von Andreas Meier

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • PS5 inkl. GoW Ragnarök oder CoD MW2 549€ • MSI RTX 4070 Ti 999€ • Gigabyte 43" 4K UHD 144 Hz 717€ • Amazon FireTV Smart-TVs bis -32% • MindStar: AMD Ryzen 7 5800X3D 285€, PowerColor RX 7900 XTX Hellhound 989€ • SanDisk Ultra NVMe 1TB 39,99€ • Samsung 980 1TB 45€ [Werbung]
    •  /