Künstliche Intelligenz: Deepmind-KI kann unbekannte Szenen wiedergeben

Googles ehemaliges KI-Tochterunternehmen Deepmind hat eine künstliche Intelligenz entwickelt, die aus Bruchstücken ihr unbekannte Szenen zusammensetzen kann. Die ersten Ergebnisse sind beeindruckend, aktuell funktioniert das System aber nur mit computergenerierten Umgebungen.

Artikel veröffentlicht am ,
Deepminds KI kann unbekannte Bereiche in Szenen vervollständigen.
Deepminds KI kann unbekannte Bereiche in Szenen vervollständigen. (Bild: Deepmind)

Das ehemalige Google-Tochterunternehmen Deepmind hat mit dem GQN-Modell ein KI-System vorgestellt, das Bruchstücke einer Szenerie beobachten, erfassen und dann die Szene komplettieren und aus bisher unbekannten Blickwinkeln darstellen kann. GQN steht für Generative Query Network, ein Framework, in dem Maschinen ihre Umgebung nur durch eigene Bewegung erfassen und darauf basierend Schlüsse ziehen.

Stellenmarkt
  1. SAP Inhouse Consultant (m/w/d) mit Schwerpunkt Logistik Module
    Covivio Immobilien GmbH, Oberhausen
  2. Testingenieur (w/m/d) in der Automobilindustrie
    Vdynamics GmbH, München
Detailsuche

Das GQN-Modell besteht aus zwei Teilen: Das sogenannte Representation Network verwendet die von der Maschine erfassten optischen Daten und erarbeitet einen Vektor, der die entsprechende Szene beschreibt. Das Generation Network stellt sich anhand dieser Daten dann die Szene vor und ergänzt fehlende Teile anhand der Beobachtungen des Representation Network.

Die Datenbasis des Representation Network ist relativ umfassend, da dieser erste Schritt des GQN-Modells nicht weiß, welche Daten der zweite Schritt, das Generation Network, letztlich abfragen wird. Der Effizienz wegen werden nur die wichtigsten Informationen gespeichert, wie etwa die Positionen und Farben von Objekten und die Grundrisse von Räumen.

In den Tests, die Deepmind mit dem GQN-Modell durchgeführt hat, konnte das System unbekannte Szenen korrekt vervollständigen - die errechnete Umgebung sah am Ende genauso aus, wie die ursprünglich gerenderte. Dabei weist die KI eine hohe Genauigkeit auf, obwohl sie nicht alle Teile der Originalszenerie kennt.

Golem Akademie
  1. Elastic Stack Fundamentals – Elasticsearch, Logstash, Kibana, Beats: virtueller Drei-Tage-Workshop
    26.–28. Oktober 2021, Virtuell
  2. Jira für Anwender: virtueller Ein-Tages-Workshop
    10. November 2021, virtuell
Weitere IT-Trainings

Das GQN-Modell hat aktuell aber noch eine gewichtige Einschränkung: Es funktioniert nicht mit realen Szenen, sondern nur mit gerenderten. Die Forscher sehen ihr Projekt dennoch als wichtigen Schritt im Bereich komplett autonomer Szenenerkennung. Die theoretischen Hintergründe haben sie in einem Paper dargelegt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Bildbearbeitungstool bei Github
Triangula und die Schönheit der Mathematik

Helferlein Triangula ist ein gelungenes Tool, um Bilder kunstvoll in Polygone zu zerlegen. Mit einem weiteren Tool können sie als Platzhalter auf Webseiten eingesetzt werden.
Von Kristof Zerbe

Bildbearbeitungstool bei Github: Triangula und die Schönheit der Mathematik
Artikel
  1. Chipmangel: Auto-Export um 23 Milliarden Euro gesunken
    Chipmangel
    Auto-Export um 23 Milliarden Euro gesunken

    Im dritten Quartal sanken die Auto-Exporte laut Statistischem Bundesamt deutlich. Die Exporte von E-Autos nahmen hingegen zu.

  2. Rupost Corporate Mail: Russland arbeitet an Ersatz für Microsoft Exchange
    Rupost Corporate Mail
    Russland arbeitet an Ersatz für Microsoft Exchange

    Astra wird 2022 für russische Behörden Rupost als Exchange-Ersatz bringen. Das Land will komplett von Microsoft weg - inklusive Windows.

  3. Giga Factory Berlin: Warum Tesla auf über eine Milliarde Euro verzichten musste
    Giga Factory Berlin
    Warum Tesla auf über eine Milliarde Euro verzichten musste

    Tesla kann die Milliarde Euro Förderung für die Akkufabrik Grünheide nicht beantragen - weil es sonst zu Verzögerungen beim Einsatz neuer Technik käme.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Heute ist Cyber Monday • AMD-CPUs zu Bestpreisen (u. a. Ryzen 7 5800X 348€) • Bis zu 50% auf beyerdynamic + Gratis-Kopfhörer • Cyber Monday bei MediaMarkt/Saturn (u. a. Xiaomi 11 Lite 5G 128GB 299€) • Alternate (u. a. be quiet Slim CPU-Kühler 29,99€) • WD Blue SN550 2TB ab 149€ [Werbung]
    •  /