Palm-E: Google stellt seine künstliche Intelligenz vor

Künstliche Intelligenz für Hausroboter ist keine Zukunftsmusik mehr. Google stellt mit der TU Berlin den Palm-E-Roboter vor.

Artikel veröffentlicht am , Patrick Klapetz
Ein von Palm-E gesteuerter Roboterarm greift in einem Demonstrationsvideo nach einer Tüte Chips.
Ein von Palm-E gesteuerter Roboterarm greift in einem Demonstrationsvideo nach einer Tüte Chips. (Bild: Google, TU Berlin)

ChatGPT bekommt Konkurrenz: Eine Gruppe von KI-Forschenden von Google und der Technischen Universität Berlin haben am 6. März 2023 ihre künstliche Intelligenz Palm-E vorgestellt. Dabei handelt es sich um ein multimodal verankertes visuelles Sprachmodell (VLM), das nicht nur Sprachbefehle entgegennimmt, sondern sie auch an einen mobilen Roboter mit einem Arm weitergeben kann.

Laut Google kann Palm-E auf einen hochrangigen Befehl reagieren und dieses ausführen, beispielsweise "Bring mir die Reis-Chips aus der Schublade". Anschließend soll der Roboter diesen Befehl selbstständig ausführen. Dazu analysiert Palm-E die Daten der Roboterkamera, ohne dass eine vorverarbeitete Szenendarstellung erforderlich ist. Damit entfällt die Notwendigkeit, dass ein Mensch die Daten vorverarbeitet oder kommentiert, was eine autonomere Robotersteuerung ermöglicht.

Zudem kann er auf seine Umwelt reagieren und die Chips-Tüte selbst dann wieder finden, nachdem ein Forscher die Tüte dem Roboter weggenommen und sie woanders hingelegt hat.

Google verkörpert Palm, indem es sensorische Informationen und Robotersteuerung hinzufügte. Da es auf einem Sprachmodell basiert, nimmt Palm-E kontinuierliche Beobachtungen wie Bilder oder Sensordaten auf. Diese codiert er in eine Sequenz von Vektoren, die dieselbe Größe wie Sprach-Token haben. Dadurch kann das Modell die sensorischen Informationen auf die gleiche Weise verstehen, wie es Sprache verarbeitet.

Gerade entstehen einige KI für Roboter

Google Robotics ist nicht die einzige Forschungsgruppe, die an der Steuerung von Robotern mit neuronalen Netzen arbeitet. Diese Arbeit ähnelt Microsofts jüngstem Paper ChatGPT for Robotics, in dem mit der Kombination von visuellen Daten und großen Sprachmodellen für die Robotersteuerung in ähnlicher Weise experimentiert wurde.

Palm-E weist einen positiven Transfer auf und kann das Wissen und die Fähigkeiten, die verarbeitet wurden, von einer Aufgabe auf eine andere übertragen. Das führt zu einer signifikant höheren Leistung im Vergleich zu Robotermodellen mit nur einer Aufgabe. "Je größer das Sprachmodell ist, desto mehr behält es seine Sprachfähigkeiten bei, wenn es für visuelle Sprach- und Robotikaufgaben trainiert wird – quantitativ gesehen behält das 562B Palm-E-Modell fast alle seine Sprachfähigkeiten bei", heißt es bei Google.

Die Google-Forscher planen, weitere Anwendungen von Palm-E für reale Szenarien wie Hausautomatisierung oder Industrierobotik zu untersuchen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Entlassungen bei Techfirmen
Weniger Manager sind besser

Entlassungen sind schlimm, aber die Begründungen dafür etwa von Meta kann ich zum Teil verstehen. Auch die Forderungen nach Rückkehr ins Büro finde ich richtig.
Ein IMHO von Brandur Leach

Entlassungen bei Techfirmen: Weniger Manager sind besser
Artikel
  1. Reddit: Stundenlanger Ausfall, weil niemand mehr den Code kennt
    Reddit
    Stundenlanger Ausfall, weil niemand mehr den Code kennt

    Die Analyse eines schwerwiegenden Ausfalls bei Reddit zeigt, wie kritisch institutionelles Wissen sein kann.

  2. LTT: Linus Tech Tips von Krypto-Scammern gehackt
    LTT
    Linus Tech Tips von Krypto-Scammern gehackt

    Der Hauptkanal der Linus Media Group auf Youtube sowie mindestens ein Neben-Channel wurden von Hackern übernommen - und für Scam-Livestreams genutzt.

  3. Spionage: USA fürchten sich vor chinesischen Kränen
    Spionage
    USA fürchten sich vor chinesischen Kränen

    Mit ihren Sensoren könnten Kräne des chinesischen Herstellers ZPMC für Spionage missbraucht oder der Warenfluss in Häfen gestört werden. In den USA ist man besorgt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Ryzen 9 7900X3D 619€ • Crucial SSD 2TB (PS5) 158€ • Neu: Amazon Smart TVs ab 189€ • Nur bis 24.03.: 38GB Allnet-Flat 12,99€ • MindStar: Ryzen 9 5900X 319€ • Nintendo Switch inkl. Spiel & Goodie 288€ • NBB Black Weeks: Rabatte bis 60% • PS5 + Spiel 569€ • LG OLED TV -57% [Werbung]
    •  /