Abo
  • Services:
Anzeige
Zeichenbot malt Vögel
Zeichenbot malt Vögel (Bild: Microsoft)

Künstliche Intelligenz: Microsofts Bot zeichnet auf Geheiß alles

Zeichenbot malt Vögel
Zeichenbot malt Vögel (Bild: Microsoft)

Wie weit künstliche Intelligenz fortgeschritten ist, lässt sich besonders gut an visuellen Aufgaben erkennen, die die Programme mittlerweile lösen können. Microsoft hat einem Bot beigebracht, das zu zeichnen, was der Nutzer ihm sagt. Fehlerfrei ist er nicht.

Der Zeichenbot wurde in den Forschungslabors von Microsoft entwickelt und so programmiert, dass er aus Textbeschreibungen heraus Bilder erstellt. Dabei achtet der Bot auf einzelne Wörter. So kann er zum Beispiel das Bild eines Vogels mit einem gelben Körper, schwarzen Flügeln und einem kurzen Schnabel zeichnen.

Anzeige

Microsofts Zeichenbot kann Bilder von alltäglichen Szenen bis hin zum Absurden erzeugen. Interessanterweise enthalten die Bilder mittlerweile Details, die in den Textbeschreibungen fehlen.

  • Der Drawing-Bot in Aktion (Bild: Microsoft)
Der Drawing-Bot in Aktion (Bild: Microsoft)

"Wenn du auf Bing nach einem Vogel suchst, bekommst du ein Vogelfoto. Aber hier werden die Bilder vom Computer, Pixel für Pixel, von Grund auf neu erstellt", so Xiaodong He, Forschungsleiter im Deep Learning Technology Center im Microsoft-Forschungslabor in Redmond, Washington. "Diese Vögel gibt es vielleicht nicht in der realen Welt - sie entsprechen nur der Vogelvorstellung unseres Computers."

Im Zentrum von Microsofts Zeichenroboter steht eine Technologie, die Generative Adversarial Network (GAN) genannt wird. Das Netzwerk nutzt zwei Modelle des maschinellen Lernens: eines, das Bilder aus Textbeschreibungen generiert und eines, das als Diskriminator bekannt ist und Textbeschreibungen verwendet, um die Authentizität der erzeugten Bilder zu beurteilen. Der Generator versucht, Fake-Bilder am Diskriminator vorbeizubekommen; der Diskriminator will sich nicht täuschen lassen. Dieses Zusammenspiel soll helfen, die generierten Bilder zu verbessern.

Microsofts Zeichenroboter wurde auf Datensätze trainiert, die Bilder und Bildbeschreibungen enthalten. Bei Microsofts Anwendung wird der eingegebene Text in einzelne Wörter zerlegt und diese Wörter bestimmten Bildbereichen zugeordnet. Da viele Bilder von Vögeln in den Trainingsdaten Vögel zeigen, die auf Ästen sitzen, zeichnet das System normalerweise Vögel, die auf Ästen sitzen, es sei denn, der Text gibt etwas anderes vor.

Das Team versuchte aber auch, den Zeichenroboter mit unsinnigen Beschreibungen zu verwirren. So wurde verlangt, einen roter Doppeldeckerbus schwebend auf einem See zu zeichnen. Es entstand ein verschwommenes Motiv, das sowohl einem Boot mit zwei Decks als auch einem Doppeldeckerbus auf einem von Bergen umgebenen See ähnelt. Die Forscher interpretieren das Ergebnis so, dass der Bot offenbar versuchte, sein Wissen, dass Boote auf Seen schwimmen, im Einklang mit dem Texthinweis auf den Bus zu bringen.

Ob es praktische Anwendungen für diese Technik gibt, wird sich noch zeigen. Microsoft glaubt, dass eine Text-zu-Bild-Generierung als Skizzenassistent für Maler und Innenarchitekten oder als Werkzeug zur sprachgesteuerten Fotobearbeitung dienen könnte. Animationsfilme könnten mit mehr Rechenleistung auf der Basis von Drehbüchern erzeugt werden.

Im Moment ist die Technologie aber noch unvollkommen. Die genaue Betrachtung der Bilder zeigt fast immer Fehler, wie zum Beispiel Vögel mit blauem statt schwarzem Schnabel.


eye home zur Startseite
Kakiss 22. Jan 2018

Es passiert sehr oft, dass Dinge von mehreren Menschen unabhängig entwickelt werden. Es...

Themenstart

Kakiss 22. Jan 2018

Das Programm welches Sprache verarbeitet und bildlich darstellt, ist hier ein Werkzeug...

Themenstart

Trockenobst 22. Jan 2018

Man sollte temporären Problemen nicht so große Bedeutung geben. Klar sind diese Probleme...

Themenstart

n0x30n 22. Jan 2018

Die Frage sollte vielmehr lauten, ob MS an all den Fotos, die sie zum Trainieren des GANs...

Themenstart

poke53281 22. Jan 2018

Das Vorgängerprojekt vor einem Jahr, das sogennante StackGAN habe ich mal kompiliert und...

Themenstart

Kommentieren



Anzeige

Stellenmarkt
  1. Haufe Group, Bielefeld
  2. Europäische Fernhochschule Hamburg GmbH, Hamburg
  3. BWI GmbH, Meckenheim
  4. über D. Kremer Consulting, Gütersloh


Anzeige
Blu-ray-Angebote
  1. (u. a. Hacksaw Ridge, Deadpool, Blade Runner, Kingsman, Arrival)
  2. (u. a. Logan Blu-ray 9,97€, Deadpool Blu-ray 8,97€, Fifty Shades of Grey Blu-ray 11,97€)

Folgen Sie uns
       


  1. Homebrew

    Bastler veröffentlichen alternativen Launcher für Switch

  2. Telekom

    15 Millionen Haushalte sollen 2018 Super Vectoring erhalten

  3. Windows Phone 7.5 und 8.0

    Microsoft schaltet Smartphone-Funktionen ab

  4. Raja Koduri

    Intel zeigt Prototyp von dediziertem Grafikchip

  5. Vizzion

    VW zeigt selbstfahrendes Auto ohne Lenkrad

  6. iOS, MacOS und WatchOS

    Apple verteilt Updates wegen Telugu-Bug

  7. Sicherheitslücken

    Mehr als 30 Klagen gegen Intel wegen Meltdown und Spectre

  8. Nightdive Studios

    Arbeit an System Shock Remake bis auf Weiteres eingestellt

  9. FTTH

    Landkreistag fordert mit Vodafone Glasfaser bis in Gebäude

  10. Programmiersprache

    Go 1.10 cacht besser und baut Brücken zu C



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Fe im Test: Fuchs im Farbenrausch
Fe im Test
Fuchs im Farbenrausch
  1. Mobile-Games-Auslese GladOS aus Portal und sowas wie Dark Souls für unterwegs
  2. Monster Hunter World im Test Das Viecher-Fleisch ist jetzt gut durch
  3. Indiegames-Rundschau Krawall mit Knetmännchen und ein Mann im Fass

Materialforschung: Stanen - ein neues Wundermaterial?
Materialforschung
Stanen - ein neues Wundermaterial?
  1. Colorfab 3D-gedruckte Objekte erhalten neue Farbgestaltung
  2. Umwelt China baut 100-Meter-Turm für die Luftreinigung
  3. Crayfis Smartphones sollen kosmische Strahlung erfassen

Samsung C27HG70 im Test: Der 144-Hz-HDR-Quantum-Dot-Monitor
Samsung C27HG70 im Test
Der 144-Hz-HDR-Quantum-Dot-Monitor
  1. Volumendisplay US-Forscher lassen Projektion schweben wie in Star Wars
  2. Sieben Touchscreens Nissan Xmotion verwendet Koi als virtuellen Assistenten
  3. CJ791 Samsung stellt gekrümmten Thunderbolt-3-Monitor vor

  1. Re: Kein brauchbares Elektrofahrzeug am Start...

    Azzuro | 10:25

  2. Re: Lineage / Android auf lumia?

    LarryLaffer | 10:23

  3. Re: Wer ist Raja Koduri?

    KnutRider | 10:21

  4. Re: Klare Kaufempfehlung

    SirFartALot | 10:21

  5. Meine Güte...

    erzgebirgszorro | 10:19


  1. 10:23

  2. 10:04

  3. 08:51

  4. 06:37

  5. 06:27

  6. 00:27

  7. 18:27

  8. 18:09


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel