Tiefe Träume mit Google

Sieben Jahre sind eine lange Zeit in der Informationstechnologie, doch in der KI-Wissenschaft ist es die Steinzeit, über die wir im Folgenden berichten.

Stellenmarkt
  1. Business Analyst Vertriebssteuerung und -controlling (m/w/d)
    DANNEMANN Cigarrenfabrik GmbH, Lübbecke
  2. 40% remote work - SAP Logistik Berater Job (m/w/x) - SAP MM, PP, EWM, LE, PM, QM oder SD Consultant ... (m/w/d)
    über duerenhoff GmbH, Raum Offenburg
Detailsuche

Im Jahr 2015 veröffentlichte der bei Google angestellte Forscher Alexander Mordvintsev das erste Programm, das Computer zum Träumen brachte: Deep Dream. Dessen Grundprinzip folgen alle weiteren hier besprochenen Netzwerke.

Vereinfacht gesagt dreht Deep Dream die Bilderkennung um. Statt einfach nur Strukturen und Inhalte zu erkennen, fügt es sie an passender Stelle in ein Ausgangsbild ein. Dabei entstehen psychedelisch wirkende, bunte Werke. Mordvintsev wollte jedoch den Computer gar nicht zu künstlerischen Äußerungen bringen, sondern den oben erwähnten Bias aufdecken.

Es sollte überprüft werden, ob die Erkennung von Inhalten in Details korrekt war: Wenn das Programm beispielsweise nur Bilder von Hunden mit Halsbändern ausgab, dann waren die Trainingsdaten unsauber und das System nahm folglich an, dass ein Halsband unabdingbar zu einem Hund gehört, ebenso wie Augen.

Golem Karrierewelt
  1. Blender Grundkurs: virtueller Drei-Tage-Workshop
    06.-08.09.2022, Virtuell
  2. Angular für Einsteiger: virtueller Zwei-Tage-Workshop
    26./27.09.2022, Virtuell
Weitere IT-Trainings

Weil Deep Dream sehr schnell populär wurde, erweiterte sich sein Spektrum 2016 um eine erste ästhetisch sinnvolle Anwendung, den Style Transfer. Damit ließen sich beliebige Bild- und Malstile auf ein Foto anwenden. In der breiten Öffentlichkeit stießen insbesondere Apps zur Verfremdung von Selbstporträts auf Interesse.

Die ersten menschlichen Gesichter wurden 2017 generiert. Das Netzwerk CAN für künstlerische Bildgeneration erschien - und brachte den ersten kleinen KI-Kunst-Skandal mit sich: Das französische Kollektiv Obvious versteigerte ein mit CAN erstelltes Bild für fast eine halbe Million US-Dollar. Das Problem: Es hatte Code kopiert und nicht darauf aufmerksam gemacht.

  • Ein detailliertes Gemälde von allem im Stil von Hieronymus Bosch (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein detailliertes Gemälde von nichts im Stil von Hieronymus Bosch (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Kamera im Stil von Darth Vader (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Mittelalter und Dystopie im Stil des Goldenen Zeitalters der Niederlande (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Duplo (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein schönes Gemälde einer Sommerwiese mit einem Raumschiff am Himmel (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Gemälde einer Geige im Stil des Futurismus (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Held (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Polaroid eines Traumes einer KI (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Prä-Raffaeliten (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Cartoon-Pferd, das über einen Stein springt, im Hintergrund braune Berge (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Polaroid einer diversen Gruppe Menschen (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Pixar-Zitrone mit Sonnenbrille am Strand (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Winterlandschaft mit einem Auge am Himmel (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine dystopische Stadtansicht mit LEDs (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Ameisenkolonie auf einem Mainboard (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Natur und Technologie (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine monochromatische Zeichnung von Edgar Allen Poe (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Raumschiff in einem Hangar (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine glückliche Mumie, die in Ägypten Fahrrad fährt (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein realistisches Gemälde der Stadt Berlin im Stil von Greg Rutkowski and Thomas Kinkade  (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Anatomieatlas einer Roboterkatze in einem wissenschaftlichen Magazin (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein detaillierter Traum einer künstlichen Intelligenz von einem Golem (Bild: Martin Wolf / Golem.de - Disco Diffusion)
Ein detaillierter Traum einer künstlichen Intelligenz von einem Golem (Bild: Martin Wolf / Golem.de - Disco Diffusion)

Wichtiger war aber eine Veröffentlichung eines Teams des Grafikkartenherstellers Nvidia.

GANs und Diffusion

StyleGAN erzeugte ab 2018 fotorealistische menschliche Gesichter. Die erfundenen Bilder werden auf Webseiten als Models angeboten, nicht existierende Personen kann man sich seitdem mit einem Klick selbst generieren. Dass die Qualität der Gesichter und vor allem deren Umgebung noch nicht wirklich überzeugt, lässt sich leicht bei einem Vergleichsexperiment der Universität Washington feststellen.

StyleGAN ist trotzdem in zweierlei Hinsicht bemerkenswert. Zunächst zementierte das Projekt die Vorherrschaft der für Deep Learning und Mustererkennung prädestinierten Hardware von Nvidia, weil es konkrete Anwendungsfälle publikumswirksam darstellte. Die CUDA-Schnittstelle der Grafikkarten (GPU) des Herstellers ermöglicht schnelle parallele Programmabläufe, was KI-Operationen entscheidend beschleunigt. Mit OpenCL steht eine ähnliche Schnittstelle für GPUs von AMD zur Verfügung, diese ist jedoch weniger weit verbreitet.

StyleGAN ist aber auch deshalb interessant, weil sein Ansatz die folgenden Jahre der KI-Bildgeneration prägte: die Nutzung von General Adversary Networks.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Deep Learning: KI krempelt die Kunst umKampf der Netzwerke 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Lemo 18. Jul 2022 / Themenstart

ist toll. Ich habe wirklich tolle Ergebnisse damit erzielen können, eines der Bilder...

FlashBFE 11. Jul 2022 / Themenstart

Na toll, ich habe mir das Beispiel gerade erst ausgedacht und da gibt es schon ne Firma...

ruphus 11. Jul 2022 / Themenstart

+1 auf jeden Fall. Ein sehr gut geschriebener Artikel! :)

mwo (Golem.de) 11. Jul 2022 / Themenstart

Ich möchte mich hiermit herzlich dafür bedanken, dass wir in Reaktion auf den Artikel...

Kommentieren



Aktuell auf der Startseite von Golem.de
25 Jahre Dungeon Keeper
Wir sind wieder richtig böse!

Nicht Held, sondern Monster: Darum geht's in Dungeon Keeper von Peter Molyneux. Golem.de hat neu gespielt - und einen bösen Bug gefunden.
Von Andreas Altenheimer

25 Jahre Dungeon Keeper: Wir sind wieder richtig böse!
Artikel
  1. bZ4X: Toyota bietet Rückkauf seiner zurückgerufenen E-Autos an
    bZ4X
    Toyota bietet Rückkauf seiner zurückgerufenen E-Autos an

    Toyota bietet Kunden den Rückkauf seiner Elektro-SUVs an, nachdem diese im Juni wegen loser Radnabenschrauben zurückgerufen wurden.

  2. Laptops: Vom Bastel-Linux zum heimlichen Liebling der Entwickler
    Laptops
    Vom Bastel-Linux zum heimlichen Liebling der Entwickler

    Noch vor einem Jahrzehnt gab es kaum Laptops mit vorinstalliertem Linux. Inzwischen liefern das aber sogar die drei weltgrößten Hersteller - ein überraschender Siegeszug.

  3. Entwicklerstudio: Eidos Montreal möchte Cyberpunk 2077 mit Deus Ex toppen
    Entwicklerstudio
    Eidos Montreal möchte Cyberpunk 2077 mit Deus Ex toppen

    Eidos Montreal würde gerne ein neues Deus Ex machen. Der Plan, damit Cyberpunk 2077 zu übertrumpfen, scheitert aber vorerst an einem Detail.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (u. a. Samsung 980 1 TB 77€ und ASRock RX 6800 639€ ) • Alternate (u. a. Corsair Vengeance LPX 8 GB DDR4-3200 34,98€ ) • AOC GM200 6,29€ • be quiet! Deals • SSV bei Saturn (u. a. WD_BLACK SN850 1 TB 119€) • Weekend Sale bei Alternate • PDP Victrix Gambit 63,16€ [Werbung]
    •  /