Abo
  • Services:

Künstliche Intelligenz: Microsofts Bot zeichnet auf Geheiß alles

Wie weit künstliche Intelligenz fortgeschritten ist, lässt sich besonders gut an visuellen Aufgaben erkennen, die die Programme mittlerweile lösen können. Microsoft hat einem Bot beigebracht, das zu zeichnen, was der Nutzer ihm sagt. Fehlerfrei ist er nicht.

Artikel veröffentlicht am ,
Zeichenbot malt Vögel
Zeichenbot malt Vögel (Bild: Microsoft)

Der Zeichenbot wurde in den Forschungslabors von Microsoft entwickelt und so programmiert, dass er aus Textbeschreibungen heraus Bilder erstellt. Dabei achtet der Bot auf einzelne Wörter. So kann er zum Beispiel das Bild eines Vogels mit einem gelben Körper, schwarzen Flügeln und einem kurzen Schnabel zeichnen.

Stellenmarkt
  1. Deutsche Forschungsgemeinschaft e.V., Bonn
  2. Hays AG, Baden-Württemberg

Microsofts Zeichenbot kann Bilder von alltäglichen Szenen bis hin zum Absurden erzeugen. Interessanterweise enthalten die Bilder mittlerweile Details, die in den Textbeschreibungen fehlen.

  • Der Drawing-Bot in Aktion (Bild: Microsoft)
Der Drawing-Bot in Aktion (Bild: Microsoft)

"Wenn du auf Bing nach einem Vogel suchst, bekommst du ein Vogelfoto. Aber hier werden die Bilder vom Computer, Pixel für Pixel, von Grund auf neu erstellt", so Xiaodong He, Forschungsleiter im Deep Learning Technology Center im Microsoft-Forschungslabor in Redmond, Washington. "Diese Vögel gibt es vielleicht nicht in der realen Welt - sie entsprechen nur der Vogelvorstellung unseres Computers."

Im Zentrum von Microsofts Zeichenroboter steht eine Technologie, die Generative Adversarial Network (GAN) genannt wird. Das Netzwerk nutzt zwei Modelle des maschinellen Lernens: eines, das Bilder aus Textbeschreibungen generiert und eines, das als Diskriminator bekannt ist und Textbeschreibungen verwendet, um die Authentizität der erzeugten Bilder zu beurteilen. Der Generator versucht, Fake-Bilder am Diskriminator vorbeizubekommen; der Diskriminator will sich nicht täuschen lassen. Dieses Zusammenspiel soll helfen, die generierten Bilder zu verbessern.

Microsofts Zeichenroboter wurde auf Datensätze trainiert, die Bilder und Bildbeschreibungen enthalten. Bei Microsofts Anwendung wird der eingegebene Text in einzelne Wörter zerlegt und diese Wörter bestimmten Bildbereichen zugeordnet. Da viele Bilder von Vögeln in den Trainingsdaten Vögel zeigen, die auf Ästen sitzen, zeichnet das System normalerweise Vögel, die auf Ästen sitzen, es sei denn, der Text gibt etwas anderes vor.

Das Team versuchte aber auch, den Zeichenroboter mit unsinnigen Beschreibungen zu verwirren. So wurde verlangt, einen roter Doppeldeckerbus schwebend auf einem See zu zeichnen. Es entstand ein verschwommenes Motiv, das sowohl einem Boot mit zwei Decks als auch einem Doppeldeckerbus auf einem von Bergen umgebenen See ähnelt. Die Forscher interpretieren das Ergebnis so, dass der Bot offenbar versuchte, sein Wissen, dass Boote auf Seen schwimmen, im Einklang mit dem Texthinweis auf den Bus zu bringen.

Ob es praktische Anwendungen für diese Technik gibt, wird sich noch zeigen. Microsoft glaubt, dass eine Text-zu-Bild-Generierung als Skizzenassistent für Maler und Innenarchitekten oder als Werkzeug zur sprachgesteuerten Fotobearbeitung dienen könnte. Animationsfilme könnten mit mehr Rechenleistung auf der Basis von Drehbüchern erzeugt werden.

Im Moment ist die Technologie aber noch unvollkommen. Die genaue Betrachtung der Bilder zeigt fast immer Fehler, wie zum Beispiel Vögel mit blauem statt schwarzem Schnabel.



Anzeige
Blu-ray-Angebote
  1. 34,99€

Kakiss 22. Jan 2018

Es passiert sehr oft, dass Dinge von mehreren Menschen unabhängig entwickelt werden. Es...

Kakiss 22. Jan 2018

Das Programm welches Sprache verarbeitet und bildlich darstellt, ist hier ein Werkzeug...

Trockenobst 22. Jan 2018

Man sollte temporären Problemen nicht so große Bedeutung geben. Klar sind diese Probleme...

n0x30n 22. Jan 2018

Die Frage sollte vielmehr lauten, ob MS an all den Fotos, die sie zum Trainieren des GANs...

poke53281 22. Jan 2018

Das Vorgängerprojekt vor einem Jahr, das sogennante StackGAN habe ich mal kompiliert und...


Folgen Sie uns
       


Shadow of the Tomb Raider - Golem.de live Teil 2

In Teil 2 des Livestreams zu Shadow of the Tomb Raider finden wir lustige Grafikfehler und der Chat trinkt zu viel Bier, kann Michael aber trotzdem bei einigen Rätseln helfen.

Shadow of the Tomb Raider - Golem.de live Teil 2 Video aufrufen
Red Dead Redemption 2 angespielt: Mit dem Trigger im Wilden Westen eintauchen
Red Dead Redemption 2 angespielt
Mit dem Trigger im Wilden Westen eintauchen

Überfälle und Schießereien, Pferde und Revolver - vor allem aber sehr viel Interaktion: Das Anspielen von Red Dead Redemption 2 hat uns erstaunlich tief in die Westernwelt versetzt. Aber auch bei Grafik und Sound konnte das nächste Programm von Rockstar Games schon Punkte sammeln.
Von Peter Steinlechner

  1. Red Dead Redemption 2 Von Bärten, Pferden und viel zu warmer Kleidung
  2. Rockstar Games Red Dead Online startet im November als Beta
  3. Rockstar Games Neuer Trailer zeigt Gameplay von Red Dead Redemption 2

Fifa 19 und PES 2019 im Test: Knapper Punktsieg für EA Sports
Fifa 19 und PES 2019 im Test
Knapper Punktsieg für EA Sports

Es ist eher eine Glaubens- als eine echte Qualitätsfrage: Fifa 19 oder PES 2019? Golem.de zieht anhand der Versionen für Playstation 4 den Vergleich - und kommt zu einem schwierigen, aber eindeutigen Urteil.
Ein Test von Olaf Bleich und Benedikt Plass-Fleßenkämper

  1. Fifa 19 angespielt Präzisionsschüsse, Zweikämpfe und mehr Taktik
  2. EA Sports Fifa 18 bekommt kostenloses WM-Update
  3. Bestseller Fifa 18 schlägt Call of Duty in Europa

Lenovo Thinkpad T480s im Test: Das trotzdem beste Business-Notebook
Lenovo Thinkpad T480s im Test
Das trotzdem beste Business-Notebook

Mit dem Thinkpad T480s verkauft Lenovo ein exzellentes 14-Zoll-Business-Notebook. Anschlüsse und Eingabegeräte überzeugen uns - leider ist aber die CPU konservativ eingestellt und ein gutes Display kostet extra.
Ein Test von Marc Sauter und Sebastian Grüner

  1. Thinkpad E480/E485 im Test AMD gegen Intel in Lenovos 14-Zoll-Notebook
  2. Lenovo Das Thinkpad P1 ist das X1 Carbon als Workstation
  3. Thinkpad Ultra Docking Station im Test Das USB-Typ-C-Dock mit robuster Mechanik

    •  /