Zum Hauptinhalt Zur Navigation Zur Suche

Deepmind: Deep-Learning-Algorithmus rendert 3D-Szene aus 2D-Bildern

Wie sieht ein Raum auf einem Foto in 3D aus, wie die Rückseite eines Objekts auf dem Bild? Die Entwickler des von Alphabet übernommenen Unternehmens Deepmind haben einen Deep-Learning-Algorithmus entwickelt, der das ohne menschliche Hilfe errechnen kann.
/ Werner Pluta
12 Kommentare News folgen (öffnet im neuen Fenster)
Deep-Learning-Algorithmus GQN: lernt ähnlich wie ein Säugling (Bild: Deepmind/Screenshot: Golem.de)
Deep-Learning-Algorithmus GQN: lernt ähnlich wie ein Säugling Bild: Deepmind/Screenshot: Golem.de

Wie sieht ein auf einem zweidimensionalen Bild dargestelltes Objekt dreidimensional aus? Sich das zu vorzustellen, fällt manchmal schon Menschen schwer. Die Entwickler von Deepmind haben einen Algorithmus entwickelt, der aus zweidimensionalen Darstellungen Objekte und Räume erzeugen kann.

Generative Query Network (GQN) nennt Deepmind das System, das die Forscher in der Fachzeitschrift Science vorstellen(öffnet im neuen Fenster). Das System besteht aus zwei Teilen: Zuerst wird das Bild analysiert und in eine mathematische Darstellung übersetzt, die eine Szene beschreibt. In einem zweiten Schritt wird daraus ein Bild erzeugt.

GQN wird mit verschiedenen 2D-Ansichten beispielsweise eines Raums mit Objekten darin gefüttert. Daraus errechnet das System eine 3D-Darstellung. Es ist in der Lage, auch eine Ansicht der nicht sichtbaren Rückseite des Objekts zu erzeugen, und berücksichtigt dabei auch den Lichteinfall und den Schattenwurf.

Deeplearning-Algorithmus GQN – Deepmind
Deeplearning-Algorithmus GQN – Deepmind (00:50)

GQN ahmt die Funktionsweise des menschlichen Gehirns nach. Er lerne ähnlich wie Säuglinge, indem er versuche, seine Beobachtung der Welt um sich herum zu verstehen, schreiben die Deepmind-Entwickler(öffnet im neuen Fenster). "Dabei erlernt GQN plausible Szenen und ihre geometrischen Eigenschaften, ohne dass der Inhalt der Szenerie vom Menschen benannt wird." Bisher sind Algorithmen für solche 3D-Renderings auf Annotationen angewiesen, die jedes Objekt in einer Szenerie beschreiben.

GQN vorgestellt – Deepmind
GQN vorgestellt – Deepmind (04:51)

Ein Team von Wissenschaftlern der University of California in Irvine hat einen Deeplearning-Algorithmus entwickelt, der sich selbst beigebracht hat, den Zauberwürfel zu lösen(öffnet im neuen Fenster). Bisherige Systeme, die den von Ernö Rubik entwickelten Würfel aus einer beliebigen Ausgangsposition lösen, nutzen dafür Algorithmen, die von Menschen entwickelt wurden.


Relevante Themen