Nvidia: Neuronales Netzwerk generiert fotorealistische Bilder

Prominente, Tiere oder Fahrzeuge: Nvidias maschineller Lernalgorithmus generiert möglichst realistische Bilder. Die Vorlage stellen 30.000 Referenzbilder. Momentan sind die Ergebnisse noch nicht ohne Fehler - es sei denn ein zweiköpfiges Pferd ist erwünscht.

Artikel veröffentlicht am ,
Noch ist Nvidias GAN nicht perfekt.
Noch ist Nvidias GAN nicht perfekt. (Bild: Nvidia)

Der Hardwarehersteller Nvidia hat ein Konzept vorgestellt, mit dem Bilder von Objekten und Personen von einem neuronalen Netzwerk automatisch erstellt werden. Das Unternehmen nutzt dazu das Konzept von Generative Adverserial Networks (GAN), bei dem ein Algorithmus die Bilder generiert und ein anderer diese auf ihre Echtheit hin bewertet. Die Modelle werden in mehreren Etappen trainiert, in denen der Detailreichtum der Bilder Schritt für Schritt erhöht wird.

Stellenmarkt
  1. (Wirtschafts-)Informatikerin als IT-Serviceverantwortliche (m/w/d) für den Bereich Netzwerk
    Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V., München
  2. IT-Mitarbeiter (m/w/d) für klinische Anwendungen und Digitalisierungsprojekte
    Diakonie-Klinikum Stuttgart, Stuttgart
Detailsuche

Erste Ergebnisse wurden in Form von Bildern mit einer Auflösung von 1.024 x 1.024 Pixeln gezeigt. Objekte wie Fahrräder, Busse oder Kirchen konnten bisher nur in 256 x 256 Pixeln gerendert werden.

Die Grundlage für die neuronalen Netzwerke bildet eine Datenbank aus 30.000 Bildern. Diese nimmt sich das System zur Vorlage und generiert nach Schlagwörtern entsprechende Motive. Erste Ergebnisse sind bereits sehr detailliert. Hauttexturen etwa können bereits vom Modell erstellt werden. Auch eine Art animierte Bilderserie erstellt das Modell. Das Ergebnis ist ein sich ständig änderndes Motiv, bei dem sich Bilder in andere Bilder morphen.

Verbesserungspotenzial für das GAN

Probleme hat Nvidias GAN-System allerdings noch bei reflektierenden Oberflächen, wie bei der feuchten Pupille eines Auges. In der Dreiviertel-Ansicht sehen einige Proportionen außerdem noch etwas verschoben aus. Nvidia berichtet im Dokument auch von Ergebnissen, bei denen ein Pferd zwei Köpfe hat oder von Frauen, die nur einen Ohrring haben.

  • Nvidia zeigt erste Ergebnisse seines GAN-Algorithmus. (Bild: Nvidia)
  • Nvidia zeigt erste Ergebnisse seines GAN-Algorithmus. (Bild: Nvidia)
  • Nvidia zeigt erste Ergebnisse seines GAN-Algorithmus. (Bild: Nvidia)
Nvidia zeigt erste Ergebnisse seines GAN-Algorithmus. (Bild: Nvidia)
Golem Akademie
  1. Cloud Computing mit Amazon Web Services (AWS): virtueller Drei-Tage-Workshop
    14.–16. Februar 2022, virtuell
  2. Java EE 8 Komplettkurs: virtueller Fünf-Tage-Workshop
    24.–28. Januar 2022, virtuell
Weitere IT-Trainings

Außerdem werden beim Begriff Fernseher vom Modell auch ähnlich aussehende Geräte wie Smartphones und Laptops generiert. Auch die Trainingszeit für das Modell ist noch immer eine Hürde: Nvidia hat dafür einen Supercomputer mit Tesla-P100-Grafikkarten 20 Tage lang laufen lassen.

Trotzdem sind viele der Ergebnisse bereits jetzt sehr fotorealistisch. Anwendungsgebiete für eine solche Technik können im Grafikdesign und in der Werbung gefunden werden. Momentan werden etwa in der Modebranche Fotomodelle zu großen Teilen noch von ausgebildetem Personal in Adobe Photoshop oder vergleichbarer Software so editiert, dass sie für den Zweck noch attraktiver wirken. Solche Aufgaben könnte in Zukunft ein Algorithmus übernehmen. Vielleicht stammt dann auch das Model selbst aus dem Computer.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Baron Münchhausen. 03. Nov 2017

Geil oder.

wlorenz65 03. Nov 2017

dim mens ... Mach dunkel den Mens! Er ist zu hell! Der Algorithmus soll nur 2D Bilder...

poke53281 02. Nov 2017

Sehr beeindruckend finde ich auch die Ergebnisse von CycleGAN: https://github.com/junyanz...

BLi8819 02. Nov 2017

Aus Pixeln ;-)

TarikVaineTree 02. Nov 2017

Ich weiß nicht, ob ich es creepy finden soll, aber das Video hat mich zumindest sehr...



Aktuell auf der Startseite von Golem.de
Geforce RTX 3000 (Ampere)
Nvidia macht Founder's Editions teurer

Die Preise der FE-Ampere-Grafikkarten steigen um bis zu 100 Euro, laut Nvidia handelt es sich schlicht um eine Inflationsbereinigung.

Geforce RTX 3000 (Ampere): Nvidia macht Founder's Editions teurer
Artikel
  1. IBM E10180-Server: Watson Health anteilig für 1 Mrd. US-Dollar verkauft
    IBM E10180-Server
    Watson Health anteilig für 1 Mrd. US-Dollar verkauft

    Mit Francisco Partners greift eine große Investmentgruppe zu, das Geschäft mit Watson Health soll laut IBM darunter aber nicht leiden.

  2. Xbox Cloud Gaming: Wenn ich groß bin, möchte ich gerne Netflix werden
    Xbox Cloud Gaming
    Wenn ich groß bin, möchte ich gerne Netflix werden

    Call of Duty, Fallout oder Halo: Neue Spiele bequem am Business-Laptop via Stream zocken, klingt zu gut, um wahr zu sein. Ist auch nicht wahr.
    Ein Erfahrungsbericht von Benjamin Sterbenz

  3. Lego Star Wars UCS AT-AT aufgebaut: Das ist kein Mond, das ist ein Lego-Modell
    Lego Star Wars UCS AT-AT aufgebaut
    "Das ist kein Mond, das ist ein Lego-Modell"

    Ganz wie der Imperator es wünscht: Der Lego UCS AT-AT ist riesig und imposant - und eines der besten Star-Wars-Modelle aus Klemmbausteinen.
    Ein Praxistest von Oliver Nickel

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MediaMarkt & Saturn: Heute alle Produkte versandkostenfrei • Corsair Vengeance RGB RT 16-GB-Kit DDR4-4000 114,90€ • Alternate (u.a. DeepCool AS500 Plus 61,89€) • Acer XV282K UHD/144 Hz 724,61€ • MindStar (u.a. be quiet! Pure Power 11 CM 600W 59€) • Sony-TVs heute im Angebot [Werbung]
    •  /