GauGAN 2: Nvidias KI-Software generiert Kunst aus Wörtern

Nvidia GauGAN 2 kann neben Formen auch Begriffe verwenden, um daraus diverse Bilder zu generieren. Es verwendet 10 Millionen Referenzbilder.

Artikel veröffentlicht am ,
Nvidias GauGAN 2 erstellt selbstständig Landschaftsbilder.
Nvidias GauGAN 2 erstellt selbstständig Landschaftsbilder. (Bild: Nvidia)

Nvidia arbeitet stetig am eigenen KI-System GauGAN. Das Generative Adversarial Network (GAN) kann in Version 2 nun auch Text interpretieren.

Diese Funktion baut der Hersteller in die Art Demo ein. Damit ist es möglich, mittels Text Parameter vorzugeben, auf deren Grundlage die Software Bilder erstellt. Die Wortgruppe "ocean waves hitting rocks on the beach" erzeugt etwa eine Szene mit steinigem Strand und einem starken Wellengang.

Die Software interpretiert einzelne Begriffe und erstellt darauf basierend zufallsgenerierte Szenen. Die Wortsuche kann außerdem zusammen mit dem bereits existierenden Skizzierungsmodus innerhalb der Nvidia-Canvas-App kombiniert werden. Künstler zeichnen damit grobe Formen ein, die jeweils ein bestimmtes Element der Natur definieren - etwa Berge, Wasser, Himmel, Sonne oder Sandstrand. Anhand dieser Formen kann das System automatisch Landschaftsszenen und Ähnliches generieren.

10 Millionen Referenzbilder

Wörter helfen dabei, etwa die Stimmung des Bildes zu verändern. Parameter wie sonnig, regnerisch oder Nebel geben der Software ein Wetter vor. Allerdings funktioniert das Ganze derzeit nur auf Englisch. GauGAN 2 wurde offensichtlich zunächst nur darin trainiert. Außerdem dienen 10 Millionen Referenzbilder aus der Landschaftfotografie als Trainingsmaterial. Der Nvidia-Supercomputer Selene hat das Modell berechnet.

GauGAN 2 kann mit Text-zu-Bild-Erkennung auch online ausprobiert werden. Den entsprechenden Editor stellt Nvidia als Web-App zur Verfügung. In Zukunft sollen solche Programme Künstlern dabei helfen, ihre Werke mit Ideen anzureichern. Das automatische Generieren von Bildern und Szenen kann eventuell auch in der Spieleentwicklung oder für Fotografie sinnvoll sein. Bis zu einer praktischen Anwendung im Endkundensegment wird es allerdings noch etwas dauern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Arbeitsschutz
Gamification in Amazon-Lagerhäusern ist gefährlich

Amazon soll das Gamification-System seiner Lagerhäuser überarbeiten, da es ein Risiko für Verletzungen der Mitarbeiter darstellt.

Arbeitsschutz: Gamification in Amazon-Lagerhäusern ist gefährlich
Artikel
  1. Kein Satellit: Chinesischer Spionageballon soll über USA fliegen
    Kein Satellit
    Chinesischer Spionageballon soll über USA fliegen

    In der Stratosphäre nahe Militäranlagen des US-Bundesstaates Montana ist ein Ballon chinesischer Herkunft entdeckt worden.

  2. Walking Simulator: Gameplay von The Day Before erntet Spott
    Walking Simulator
    Gameplay von The Day Before erntet Spott

    Nach Betrugsvorwürfen haben die Entwickler von The Day Before nun Gameplay veröffentlicht - das nicht besonders gut ankommt.

  3. Software: Wie Entwickler Fehler aufspüren - oder gleich vermeiden
    Software
    Wie Entwickler Fehler aufspüren - oder gleich vermeiden

    Es gibt zahlreiche Arten von Softwarefehlern. Wir erklären, welche Testverfahren sie am zuverlässigsten finden und welche Methoden es gibt, um ihnen vorzubeugen.
    Von Michael Bröde

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Mindfactory DAMN-Deals: Grakas, CPUs & Co. • HTC Vice 2 Pro Full Kit 899€ • RAM-Tiefstpreise • Amazon-Geräte bis -50% • Samsung TVs bis 1.000€ Cashback • Corsair HS80 7.1-Headset -42% • PCGH Cyber Week • Samsung Curved 27" WQHD 267,89€ • Samsung Galaxy S23 vorbestellbar [Werbung]
    •  /