GauGAN 2: Nvidias KI-Software generiert Kunst aus Wörtern

Nvidia GauGAN 2 kann neben Formen auch Begriffe verwenden, um daraus diverse Bilder zu generieren. Es verwendet 10 Millionen Referenzbilder.

Artikel veröffentlicht am ,
Nvidias GauGAN 2 erstellt selbstständig Landschaftsbilder.
Nvidias GauGAN 2 erstellt selbstständig Landschaftsbilder. (Bild: Nvidia)

Nvidia arbeitet stetig am eigenen KI-System GauGAN. Das Generative Adversarial Network (GAN) kann in Version 2 nun auch Text interpretieren.

Stellenmarkt
  1. Softwareentwickler (m/w/d) Automatisierungstechnik
    Dürr Systems AG, Goldkronach
  2. IT-Administrator (m/w/d)
    Schiller Automation GmbH & Co. KG, Sonnenbühl
Detailsuche

Diese Funktion baut der Hersteller in die Art Demo ein. Damit ist es möglich, mittels Text Parameter vorzugeben, auf deren Grundlage die Software Bilder erstellt. Die Wortgruppe "ocean waves hitting rocks on the beach" erzeugt etwa eine Szene mit steinigem Strand und einem starken Wellengang.

Die Software interpretiert einzelne Begriffe und erstellt darauf basierend zufallsgenerierte Szenen. Die Wortsuche kann außerdem zusammen mit dem bereits existierenden Skizzierungsmodus innerhalb der Nvidia-Canvas-App kombiniert werden. Künstler zeichnen damit grobe Formen ein, die jeweils ein bestimmtes Element der Natur definieren - etwa Berge, Wasser, Himmel, Sonne oder Sandstrand. Anhand dieser Formen kann das System automatisch Landschaftsszenen und Ähnliches generieren.

10 Millionen Referenzbilder

Wörter helfen dabei, etwa die Stimmung des Bildes zu verändern. Parameter wie sonnig, regnerisch oder Nebel geben der Software ein Wetter vor. Allerdings funktioniert das Ganze derzeit nur auf Englisch. GauGAN 2 wurde offensichtlich zunächst nur darin trainiert. Außerdem dienen 10 Millionen Referenzbilder aus der Landschaftfotografie als Trainingsmaterial. Der Nvidia-Supercomputer Selene hat das Modell berechnet.

Golem Akademie
  1. Unreal Engine 4 Grundlagen: virtueller Drei-Tage-Workshop
    28. Februar–2. März 2022, Virtuell
  2. Kotlin für Java-Entwickler: virtueller Zwei-Tage-Workshop
    03.–04. Februar 2022, Virtuell
Weitere IT-Trainings

GauGAN 2 kann mit Text-zu-Bild-Erkennung auch online ausprobiert werden. Den entsprechenden Editor stellt Nvidia als Web-App zur Verfügung. In Zukunft sollen solche Programme Künstlern dabei helfen, ihre Werke mit Ideen anzureichern. Das automatische Generieren von Bildern und Szenen kann eventuell auch in der Spieleentwicklung oder für Fotografie sinnvoll sein. Bis zu einer praktischen Anwendung im Endkundensegment wird es allerdings noch etwas dauern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Reddit
IT-Arbeiter automatisiert seinen Job angeblich vollständig

Ein anonymer Entwickler will unbemerkt seinen Job vollständig automatisiert haben. Dem Arbeitgeber sei dies seit einem Jahr nicht aufgefallen.

Reddit: IT-Arbeiter automatisiert seinen Job angeblich vollständig
Artikel
  1. Deutsche Telekom: iPads für mehr als 400.000 Schüler in Rheinland-Pfalz
    Deutsche Telekom
    iPads für mehr als 400.000 Schüler in Rheinland-Pfalz

    Rheinland-Pfalz beschafft iPads für 1.660 Schulen. Die Ausschreibung hat die Deutsche Telekom gewonnen. Auch Notebooks gibt es.

  2. Bundesservice Telekommunikation: Ist eine scheinexistente Behörde für Wikipedia relevant?
    Bundesservice Telekommunikation  
    Ist eine scheinexistente Behörde für Wikipedia relevant?

    Die IT-Sicherheitsexpertin Lilith Wittmann hat eine dubiose Bundesbehörde ohne Budget entdeckt. Reicht das für einen Wikipedia-Artikel?

  3. Elektroauto: VW e-Up ab Mitte Februar wieder bestellbar
    Elektroauto
    VW e-Up ab Mitte Februar wieder bestellbar

    Der e-Up gehörte 2021 zu den meistgekauften Elektroautos. Nun will VW den Kleinwagen wieder verfügbar machen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • RTX 3080 12GB bei Mindfactory • MindStar (u.a. GTX 1660 6GB 499€) • Sony Kopfhörer&Lautsprecher zu Bestpreisen • RTX 2060 12GB 569€ • Bosch Professional zu Bestpreisen • Luftreiniger ab 159,99€ • WSV bei MediaMarkt • RX 6900 16GB 1.499€ [Werbung]
    •  /