GauGAN 2: Nvidias KI-Software generiert Kunst aus Wörtern
Nvidia GauGAN 2 kann neben Formen auch Begriffe verwenden, um daraus diverse Bilder zu generieren. Es verwendet 10 Millionen Referenzbilder.

Nvidia arbeitet stetig am eigenen KI-System GauGAN. Das Generative Adversarial Network (GAN) kann in Version 2 nun auch Text interpretieren.
Diese Funktion baut der Hersteller in die Art Demo ein. Damit ist es möglich, mittels Text Parameter vorzugeben, auf deren Grundlage die Software Bilder erstellt. Die Wortgruppe "ocean waves hitting rocks on the beach" erzeugt etwa eine Szene mit steinigem Strand und einem starken Wellengang.
Die Software interpretiert einzelne Begriffe und erstellt darauf basierend zufallsgenerierte Szenen. Die Wortsuche kann außerdem zusammen mit dem bereits existierenden Skizzierungsmodus innerhalb der Nvidia-Canvas-App kombiniert werden. Künstler zeichnen damit grobe Formen ein, die jeweils ein bestimmtes Element der Natur definieren - etwa Berge, Wasser, Himmel, Sonne oder Sandstrand. Anhand dieser Formen kann das System automatisch Landschaftsszenen und Ähnliches generieren.
10 Millionen Referenzbilder
Wörter helfen dabei, etwa die Stimmung des Bildes zu verändern. Parameter wie sonnig, regnerisch oder Nebel geben der Software ein Wetter vor. Allerdings funktioniert das Ganze derzeit nur auf Englisch. GauGAN 2 wurde offensichtlich zunächst nur darin trainiert. Außerdem dienen 10 Millionen Referenzbilder aus der Landschaftfotografie als Trainingsmaterial. Der Nvidia-Supercomputer Selene hat das Modell berechnet.
GauGAN 2 kann mit Text-zu-Bild-Erkennung auch online ausprobiert werden. Den entsprechenden Editor stellt Nvidia als Web-App zur Verfügung. In Zukunft sollen solche Programme Künstlern dabei helfen, ihre Werke mit Ideen anzureichern. Das automatische Generieren von Bildern und Szenen kann eventuell auch in der Spieleentwicklung oder für Fotografie sinnvoll sein. Bis zu einer praktischen Anwendung im Endkundensegment wird es allerdings noch etwas dauern.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
eine richtige wulst ist auch ne kunst ^^