Abo
  • Services:

Künstliche Intelligenz: Microsofts Bot zeichnet auf Geheiß alles

Wie weit künstliche Intelligenz fortgeschritten ist, lässt sich besonders gut an visuellen Aufgaben erkennen, die die Programme mittlerweile lösen können. Microsoft hat einem Bot beigebracht, das zu zeichnen, was der Nutzer ihm sagt. Fehlerfrei ist er nicht.

Artikel veröffentlicht am ,
Zeichenbot malt Vögel
Zeichenbot malt Vögel (Bild: Microsoft)

Der Zeichenbot wurde in den Forschungslabors von Microsoft entwickelt und so programmiert, dass er aus Textbeschreibungen heraus Bilder erstellt. Dabei achtet der Bot auf einzelne Wörter. So kann er zum Beispiel das Bild eines Vogels mit einem gelben Körper, schwarzen Flügeln und einem kurzen Schnabel zeichnen.

Stellenmarkt
  1. infoteam Software AG, Bubenreuth,Dortmund
  2. ETAS GmbH, Stuttgart

Microsofts Zeichenbot kann Bilder von alltäglichen Szenen bis hin zum Absurden erzeugen. Interessanterweise enthalten die Bilder mittlerweile Details, die in den Textbeschreibungen fehlen.

  • Der Drawing-Bot in Aktion (Bild: Microsoft)
Der Drawing-Bot in Aktion (Bild: Microsoft)

"Wenn du auf Bing nach einem Vogel suchst, bekommst du ein Vogelfoto. Aber hier werden die Bilder vom Computer, Pixel für Pixel, von Grund auf neu erstellt", so Xiaodong He, Forschungsleiter im Deep Learning Technology Center im Microsoft-Forschungslabor in Redmond, Washington. "Diese Vögel gibt es vielleicht nicht in der realen Welt - sie entsprechen nur der Vogelvorstellung unseres Computers."

Im Zentrum von Microsofts Zeichenroboter steht eine Technologie, die Generative Adversarial Network (GAN) genannt wird. Das Netzwerk nutzt zwei Modelle des maschinellen Lernens: eines, das Bilder aus Textbeschreibungen generiert und eines, das als Diskriminator bekannt ist und Textbeschreibungen verwendet, um die Authentizität der erzeugten Bilder zu beurteilen. Der Generator versucht, Fake-Bilder am Diskriminator vorbeizubekommen; der Diskriminator will sich nicht täuschen lassen. Dieses Zusammenspiel soll helfen, die generierten Bilder zu verbessern.

Microsofts Zeichenroboter wurde auf Datensätze trainiert, die Bilder und Bildbeschreibungen enthalten. Bei Microsofts Anwendung wird der eingegebene Text in einzelne Wörter zerlegt und diese Wörter bestimmten Bildbereichen zugeordnet. Da viele Bilder von Vögeln in den Trainingsdaten Vögel zeigen, die auf Ästen sitzen, zeichnet das System normalerweise Vögel, die auf Ästen sitzen, es sei denn, der Text gibt etwas anderes vor.

Das Team versuchte aber auch, den Zeichenroboter mit unsinnigen Beschreibungen zu verwirren. So wurde verlangt, einen roter Doppeldeckerbus schwebend auf einem See zu zeichnen. Es entstand ein verschwommenes Motiv, das sowohl einem Boot mit zwei Decks als auch einem Doppeldeckerbus auf einem von Bergen umgebenen See ähnelt. Die Forscher interpretieren das Ergebnis so, dass der Bot offenbar versuchte, sein Wissen, dass Boote auf Seen schwimmen, im Einklang mit dem Texthinweis auf den Bus zu bringen.

Ob es praktische Anwendungen für diese Technik gibt, wird sich noch zeigen. Microsoft glaubt, dass eine Text-zu-Bild-Generierung als Skizzenassistent für Maler und Innenarchitekten oder als Werkzeug zur sprachgesteuerten Fotobearbeitung dienen könnte. Animationsfilme könnten mit mehr Rechenleistung auf der Basis von Drehbüchern erzeugt werden.

Im Moment ist die Technologie aber noch unvollkommen. Die genaue Betrachtung der Bilder zeigt fast immer Fehler, wie zum Beispiel Vögel mit blauem statt schwarzem Schnabel.



Anzeige
Hardware-Angebote
  1. 249,90€ + Versand (im Preisvergleich über 280€)
  2. (Neuware für kurze Zeit zum Sonderpreis bei Mindfactory)
  3. bei dell.com

Folgen Sie uns
       


Samsung Galaxy S9 und S9 Plus - Test

Das Galaxy S9 und das Galaxy S9+ sind Samsungs neue Oberklasse-Smartphones. Golem.de hat sich im Test besonders die neuen Kameras angeschaut, die eine variable Blende haben.

Samsung Galaxy S9 und S9 Plus - Test Video aufrufen
BeA: Rechtsanwaltsregister wegen Sicherheitslücke abgeschaltet
BeA
Rechtsanwaltsregister wegen Sicherheitslücke abgeschaltet

Das deutsche Rechtsanwaltsregister hat eine schwere Sicherheitslücke. Schuld daran ist eine veraltete Java-Komponente, die für einen Padding-Oracle-Angriff verwundbar ist. Das Rechtsanwaltsregister ist Teil des besonderen elektronischen Anwaltspostfachs, war aber anders als dieses weiterhin online.
Eine Exklusivmeldung von Hanno Böck

  1. BeA Secunet findet noch mehr Lücken im Anwaltspostfach
  2. EGVP Empfangsbestätigungen einer Klage sind verwertbar
  3. BeA Anwälte wollen Ende-zu-Ende-Verschlüsselung einklagen

HP Z2 Mini Workstation G3 im Test: Leises Rauschen hinterm Monitor
HP Z2 Mini Workstation G3 im Test
Leises Rauschen hinterm Monitor

Unterm Tisch, auf dem Tisch oder hinter den Bildschirm geklemmt: HPs Z2 Mini Workstation ist ein potentes, wenn auch nicht gerade sehr preiswertes Komplettsystem. Den Preis ist der PC aber wert, denn er ist leise, modular und kann einfach gewartet werden. Der Admin dankt!
Ein Test von Oliver Nickel

  1. HP Pavilion Gaming Hardware für Gamer, die sich Omen nicht leisten wollen
  2. Chromebook x2 HP präsentiert Chrome-OS-Detachable mit Stift
  3. Laserjet Pro M15w und M28w HPs Laserdrucker schrumpfen auf 34 Zentimeter Länge

Razer Nommo Chroma im Test: Blinkt viel, klingt weniger
Razer Nommo Chroma im Test
Blinkt viel, klingt weniger

Wenn die Razer Nommo Chroma eines sind, dann auffällig. Dafür sorgen die ungewöhnliche Form und die LED-Ringe, die sich beliebig konfigurieren lassen. Die Lautsprecher sind aber eher ein Hingucker als ein Hinhörer.
Ein Test von Oliver Nickel

  1. Razer Kiyo und Seiren X im Test Nicht professionell, aber schnell im Einsatz
  2. Stereolautsprecher Razer Nommo "Sind das Haartrockner?"
  3. Nextbit Cloud-Speicher für Robin-Smartphone wird abgeschaltet

    •  /