Deepmind: Deep-Learning-Algorithmus rendert 3D-Szene aus 2D-Bildern

Wie sieht ein Raum auf einem Foto in 3D aus, wie die Rückseite eines Objekts auf dem Bild? Die Entwickler des von Alphabet übernommenen Unternehmens Deepmind haben einen Deep-Learning-Algorithmus entwickelt, der das ohne menschliche Hilfe errechnen kann.

Artikel veröffentlicht am ,
Deep-Learning-Algorithmus GQN: lernt ähnlich wie ein Säugling
Deep-Learning-Algorithmus GQN: lernt ähnlich wie ein Säugling (Bild: Deepmind/Screenshot: Golem.de)

Wie sieht ein auf einem zweidimensionalen Bild dargestelltes Objekt dreidimensional aus? Sich das zu vorzustellen, fällt manchmal schon Menschen schwer. Die Entwickler von Deepmind haben einen Algorithmus entwickelt, der aus zweidimensionalen Darstellungen Objekte und Räume erzeugen kann.

Stellenmarkt
  1. IT-Softwareingenieur (w/m/d) 1st Level
    SSI SCHÄFER Automation GmbH, Giebelstadt
  2. Support-Specialist (m/w/d)
    Allianz Technology SE, Hamburg
Detailsuche

Generative Query Network (GQN) nennt Deepmind das System, das die Forscher in der Fachzeitschrift Science vorstellen. Das System besteht aus zwei Teilen: Zuerst wird das Bild analysiert und in eine mathematische Darstellung übersetzt, die eine Szene beschreibt. In einem zweiten Schritt wird daraus ein Bild erzeugt.

GQN wird mit verschiedenen 2D-Ansichten beispielsweise eines Raums mit Objekten darin gefüttert. Daraus errechnet das System eine 3D-Darstellung. Es ist in der Lage, auch eine Ansicht der nicht sichtbaren Rückseite des Objekts zu erzeugen, und berücksichtigt dabei auch den Lichteinfall und den Schattenwurf.

GQN ahmt die Funktionsweise des menschlichen Gehirns nach. Er lerne ähnlich wie Säuglinge, indem er versuche, seine Beobachtung der Welt um sich herum zu verstehen, schreiben die Deepmind-Entwickler. "Dabei erlernt GQN plausible Szenen und ihre geometrischen Eigenschaften, ohne dass der Inhalt der Szenerie vom Menschen benannt wird." Bisher sind Algorithmen für solche 3D-Renderings auf Annotationen angewiesen, die jedes Objekt in einer Szenerie beschreiben.

Golem Akademie
  1. First Response auf Security Incidents: Ein-Tages-Workshop
    14.11.2022, Virtuell
  2. Informationssicherheit in der Automobilindustrie nach VDA-ISA und TISAX® mit Zertifikat: Zwei-Tage-Workshop
    19./20.07.2022, Virtuell
Weitere IT-Trainings

Ein Team von Wissenschaftlern der University of California in Irvine hat einen Deeplearning-Algorithmus entwickelt, der sich selbst beigebracht hat, den Zauberwürfel zu lösen. Bisherige Systeme, die den von Ernö Rubik entwickelten Würfel aus einer beliebigen Ausgangsposition lösen, nutzen dafür Algorithmen, die von Menschen entwickelt wurden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


TheBigLou13 20. Jun 2018

Oder allgemein es zur 3D-Modellierung nutzt um Skizzen in 3D-Landschaften umzuwandeln. Es...

wlorenz65 19. Jun 2018

Der Algorithmus kann nicht mit Zeit umgehen. Wenn die Tür zu ist, weil du den Schalter...

KlugKacka 18. Jun 2018

Danke für den Hinweis. Ich muss mal nachforschen, wieso Heise solange braucht zum laden...



Aktuell auf der Startseite von Golem.de
LG HU915QE
Laserprojektor erzeugt 90-Zoll-Bild aus 5,6 cm Entfernung

LG hat einen Kurzdistanzprojektor mit Lasertechnik vorgestellt. Der HU915QE erzeugt ein riesiges Bild und steht dabei fast an der Wand.

LG HU915QE: Laserprojektor erzeugt 90-Zoll-Bild aus 5,6 cm Entfernung
Artikel
  1. Snapdragon 8+ Gen1: 4 nm TSMC spart 30 Prozent bei Qualcomm-SoC
    Snapdragon 8+ Gen1
    4 nm TSMC spart 30 Prozent bei Qualcomm-SoC

    Durch den Wechsel des Fertigungsverfahrens ist der Snapdragon 8+ Gen1 deutlich effizienter als der Snapdragon 8 Gen1, selbst bei mehr Takt.

  2. Verkaufsstart des 9-Euro-Tickets: Was Fahrgäste wissen müssen
    Verkaufsstart des 9-Euro-Tickets
    Was Fahrgäste wissen müssen

    Das 9-Euro-Ticket für den ÖPNV ist beschlossene Sache, Verkehrsverbünde und -unternehmen sehen sich auf den Verkaufsstart in diesen Tagen gut vorbereitet. Doch es gibt viele offene Fragen.

  3. LTE-Patent: Ford droht Verkaufs- und Produktionsverbot in Deutschland
    LTE-Patent
    Ford droht Verkaufs- und Produktionsverbot in Deutschland

    Ford fehlen Mobilfunk-Patentlizenzen, weshalb das Landgericht München eine drastische Entscheidung gefällt hat. Autos droht sogar die Vernichtung.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Acer Predator X38S (UWQHD, 175 Hz OC) 1.499€ • MindStar (u. a. AMD Ryzen 7 5700X 268€ und PowerColor RX 6750 XT Red Devil 609€ und RX 6900 XT Red Devil Ultimate 949€) • Alternate (u. a. Cooler Master Caliber R1 159,89€) • SanDisk Portable SSD 1 TB 81€ • Motorola Moto G60s 149€ [Werbung]
    •  /