Deep Learning: KI krempelt die Kunst um

Wir lassen unseren Rechner träumen und zeigen, wie zurzeit mit Deep Learning bei der KI-Kunst Geschichte geschrieben wird.

Artikel von Martin Wolf veröffentlicht am
"A detailed painting of an allegory of truth and lies" - Disco Diffusion (Versuch 55)
"A detailed painting of an allegory of truth and lies" - Disco Diffusion (Versuch 55) (Bild: Martin Wolf / Golem.de)

"Ein detailliertes Gemälde von allem im Stil von Hieronymus Bosch" - diesen Auftrag geben wir unserer Kunst-KI. Wir bekommen ein Bild, auf dem sich zahlreiche unidentifizierbare Wesen in einer Landschaft tummeln. Nicht ganz zeitgenössisch ist der Vordergrund defokussiert wie auf einem Foto.

Inhalt:
  1. Deep Learning: KI krempelt die Kunst um
  2. Tiefe Träume mit Google
  3. Kampf der Netzwerke
  4. Selbst einsteigen in die KI-Kunst

Das mag daran liegen, dass wir noch das Stichwort Unreal Engine 3 hinzugefügt haben. Interessanterweise bringt uns die Zeile: "Ein detailliertes Gemälde von nichts im Stil von Hieronymus Bosch" ein recht ähnliches Ergebnis und zeigt eine Vorliebe unseres Programmes für Kugeln. Visuell ansprechend sind beide Bilder - aber Kunst sind sie ganz sicher nicht.

Erst seit den 2020er Jahren ist die komplette Erstellung von Bildern und Videos auf Basis eines einzigen Wortes oder Satzes möglich - inklusive Anmerkungen zum gewünschten Stil. Seitdem hat sich eine Menge getan. Wenn die Entwicklung in dieser Geschwindigkeit weiter vorangeht, dann sind Stockfotos, Gebrauchsillustrationen und viele Bereiche der Bildgestaltung in wenigen Jahren durch künstliche Intelligenz ersetzbar - und die Menschen, die sie entwerfen, müssen sich nach neuen Jobs umsehen.

Wir geben hier einen kurzen Überblick über die Entwicklung zum aktuellen Stand der Technologie und zeigen ein paar Möglichkeiten, selbst eine KI zum Träumen zu bringen.

Mustererkennung als Grundlage

Stellenmarkt
  1. Senior Software-Entwickler (m/w/d) PowerBuilder
    efcom gmbh, Neu-Isenburg
  2. Mitarbeiter (m/w/d) IT-Support
    Otto Krahn Group GmbH, Hamburg
Detailsuche

Künstliche Intelligenz ist in diesem Zusammenhang ein sehr ungenauer Begriff, denn es handelt sich um maschinelles Lernen, genauer: Deep Learning.

Deep Learning basiert auf Mustererkennung und einer schrittweisen Verfeinerung der Datenauswertung über viele Ebenen, die wie Neuronen im Gehirn miteinander agieren. Sie verstärken Wege zu gewünschten Ergebnissen und verwerfen unerwünschte. Aber woher weiß das System, was wir wollen und was nicht?

Hier kommen Trainingsdaten ins Spiel. Anhand aufbereiteter Datensätze, die von Menschen klassifiziert wurden, kann das Netzwerk neue Daten auf ähnliche Weise behandeln. Ein einfaches Beispiel wäre die Erkennung einer Katze auf einem Bild. Wenn dem Netzwerk genügend Daten von Bildern mit als Katzen definierten Inhalten zur Verfügung gestellt wurden, wird es anhand der Mustererkennung selbst Katzen lokalisieren.

  • Ein detailliertes Gemälde von allem im Stil von Hieronymus Bosch (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein detailliertes Gemälde von nichts im Stil von Hieronymus Bosch (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Kamera im Stil von Darth Vader (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Mittelalter und Dystopie im Stil des Goldenen Zeitalters der Niederlande (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Duplo (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein schönes Gemälde einer Sommerwiese mit einem Raumschiff am Himmel (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Gemälde einer Geige im Stil des Futurismus (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Held (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Polaroid eines Traumes einer KI (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Prä-Raffaeliten (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Cartoon-Pferd, das über einen Stein springt, im Hintergrund braune Berge (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Polaroid einer diversen Gruppe Menschen (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Pixar-Zitrone mit Sonnenbrille am Strand (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Winterlandschaft mit einem Auge am Himmel (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine dystopische Stadtansicht mit LEDs (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine Ameisenkolonie auf einem Mainboard (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Natur und Technologie (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine monochromatische Zeichnung von Edgar Allen Poe (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein Raumschiff in einem Hangar (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Eine glückliche Mumie, die in Ägypten Fahrrad fährt (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein realistisches Gemälde der Stadt Berlin im Stil von Greg Rutkowski and Thomas Kinkade  (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Anatomieatlas einer Roboterkatze in einem wissenschaftlichen Magazin (Bild: Martin Wolf / Golem.de - Disco Diffusion)
  • Ein detaillierter Traum einer künstlichen Intelligenz von einem Golem (Bild: Martin Wolf / Golem.de - Disco Diffusion)
Ein detailliertes Gemälde von allem im Stil von Hieronymus Bosch (Bild: Martin Wolf / Golem.de - Disco Diffusion)

Im Training steckt auch eines der größten Probleme aller derzeitigen Netzwerke. Während ein Kind nach dem Ansehen und Lernen des Inhaltes Katze sehr schnell jede Katze in jeder möglichen Position - zum Beispiel mit gedrehtem Kopf - identifizieren kann, würde das Netzwerk gnadenlos scheitern, wenn die Trainingsdaten keine Bilder von Katzen in Profilansicht enthielten.

Das mag bei Katzenbildern kein Drama sein - aber eine solche Bias genannte Wahrnehmungsverzerrung kann gravierende Folgen haben, wenn es um KI-Entscheidungen geht, die das Leben von Menschen beeinflussen. Besonders problematisch ist dabei, dass sich aufgrund der schlechten Nachvollziehbarkeit der Ergebnisse von KI-Netzwerken sehr schwer feststellen lässt, ob ein Bias (eine Voreingenommenheit) vorliegt und woher er stammt. Deshalb ist die Vermeidung von Bias eine der wichtigsten ethischen Regeln bei der Entwicklung von selbstlernenden Netzwerken.

Bias und ethische Bedenken werden im Folgenden wieder eine Rolle spielen, aber zunächst werfen wir einen Blick zurück auf die ersten funktionierenden Bildgeneratoren, um die Wucht der Entwicklung der letzten Jahre zu zeigen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Tiefe Träume mit Google 
  1. 1
  2. 2
  3. 3
  4. 4
  5.  


Lemo 18. Jul 2022 / Themenstart

ist toll. Ich habe wirklich tolle Ergebnisse damit erzielen können, eines der Bilder...

FlashBFE 11. Jul 2022 / Themenstart

Na toll, ich habe mir das Beispiel gerade erst ausgedacht und da gibt es schon ne Firma...

ruphus 11. Jul 2022 / Themenstart

+1 auf jeden Fall. Ein sehr gut geschriebener Artikel! :)

mwo (Golem.de) 11. Jul 2022 / Themenstart

Ich möchte mich hiermit herzlich dafür bedanken, dass wir in Reaktion auf den Artikel...

Kommentieren



Aktuell auf der Startseite von Golem.de
Krieg der Steine
Kopierte Lego-Mini-Figuren dürfen nicht verkauft werden

Lego hat einen Rechtsstreit um Mini-Figuren gegen einen Spielwarenhändler gewonnen, der Figuren aus China verkauft hat.

Krieg der Steine: Kopierte Lego-Mini-Figuren dürfen nicht verkauft werden
Artikel
  1. Smartphones: Xiaomis neues Foldable ist wesentlich günstiger
    Smartphones
    Xiaomis neues Foldable ist wesentlich günstiger

    Das Xiaomi Mix Fold 2 ähnelt dem Samsung Galaxy Fold 4. Es ist ähnlich gut ausgestattet, kostet aber wesentlich weniger Geld.

  2. USA: Tesla stoppt Bestellungen für das Model 3 Long Range
    USA
    Tesla stoppt Bestellungen für das Model 3 Long Range

    In den USA und Kanada übersteigt die Nachfrage nach dem Tesla Model 3 LR das Angebot, so dass Tesla erstmal keine Bestellungen mehr annimmt.

  3. Web Components mit StencilJS: Mehr Klarheit im Frontend
    Web Components mit StencilJS
    Mehr Klarheit im Frontend

    Je mehr UI/UX in Anwendungen vorkommt, desto mehr Unordnung gibt es im Frontend. StencilJS zeigt, wie man verschiedene Frameworks mit Web Components zusammenbringt.
    Eine Anleitung von Martin Reinhardt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • BenQ Mobiuz EX3410R 499€ • HyperX Cloud Flight heute für 44€ • MindStar (u. a. AMD Ryzen 5 5600X 169€, Intel Core i5-12400F 179€ und GIGABYTE RTX 3070 Ti Master 8G 699€ + 20€ Cashback) • Weekend Sale bei Alternate (u. a. AKRacing Master PRO für 353,99€) [Werbung]
    •  /