OpenAI: Roboterarm löst Zauberwürfel einhändig

Zuerst in Tausenden parallelen Simulationen, dann in der echten Welt: Der Roboterarm von OpenAI kann bereits einen Zauberwürfel einhändig lösen. Gesteuert wird er von einer Software, die sich den Ablauf selbst beigebracht hat. Trotzdem ist das in der echten Welt noch eine Herausforderung.

Artikel veröffentlicht am ,
Der Roboterarm von OpenAI bewegt sich fast wie eine echte Hand.
Der Roboterarm von OpenAI bewegt sich fast wie eine echte Hand. (Bild: OpenAI)

Forscher der KI-Initiative OpenAI haben einen Roboterarm entwickelt, der diverse feinmotorische Aufgaben bewältigen kann. Ein erster Erfolg: Die Maschine hat einen Rubik's Cube - auch Zauberwürfel genannt - einhändig und selbstständig gelöst. Die Grundlage ist ein Machine-Learning-Programm basierend auf dem Prinzip des Reinforcement Learning. Dieses steuert Finger und Gelenke der Hand.

Stellenmarkt
  1. Chief Information Security Officer / CISO (m/f/d
    J.M. Voith SE & Co. KG, Heidenheim
  2. Technikkoordinator/in Datenaustausch (w/m/d)
    Statistisches Bundesamt, Wiesbaden
Detailsuche

Um das zu erreichen, standen die Forscher vor einer Herausforderung: Wie kann Software virtuell parallel Lösungsansätze trainieren? Es wurde dazu eine virtuele Umgebung programmiert, die physikalische Gesetze der Physik simuliert. Dort wird ein Modell der Roboterhand und dessen Sensoren eingesetzt. Solche Umgebungen können dann tausendfach parallel ablaufen. Das Programm lernt so wesentlich schneller, wie es mit dem Zauberwürfel umgehen soll.

Die Trainingsumgebungen werden durch den Algorithmus Automatic Domain Randomization (ADR) erstellt. Dieser generiert von Schritt zu Schritt kontinuierlich schwerere und zufällig aufgebaute Szenarien, die das System bewältigen muss. Ein zufallsgenerierter Parameter ist etwa die Größe des Zauberwürfels.

Erfolg nicht garantiert

Das so trainierte Modell haben die Forscher anschließend auf die echte Welt übertragen. Dort haben sie den Roboterarm ebenfalls unter verschiedenen Bedingungen laufen lassen. In einem Versuch hat er zwei zusammengebundene Finger, mal hat er einen Gummihandschuh an, mal wird der Zauberwürfel durch äußere Einflüsse angestupst. Das Ziel ist es, den Arm so robust gegen Außeneinwirkung wie möglich zu machen. In einem zukünftigen praktischen Einsatz in der echten Welt wäre das essenziell.

Golem Akademie
  1. Einführung in die Programmierung mit Rust: virtueller Fünf-Halbtage-Workshop
    21.–25. März 2022, Virtuell
  2. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    13.–16. Dezember 2021, virtuell
Weitere IT-Trainings

Den Rubik's Cube löst der Arm zumindest noch immer nicht voll zuverlässig. 20 Prozent aller zeitbegrenzten Versuche führen zum Erfolg, wenn die Farben des Würfels für den schlechtesten Fall gemischt werden und 26 Drehungen notwendig sind. In einem durchschnittlichen Szenario schafft der Roboter immerhin 60 Prozent aller Versuche mit Erfolg.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Kanadische Polizei
Diebe nutzen Apples Airtags zum Tracking von Luxuswagen

Autodiebe in Kanada nutzen offenbar Apples Airtags, um Fahrzeuge heimlich zu orten.

Kanadische Polizei: Diebe nutzen Apples Airtags zum Tracking von Luxuswagen
Artikel
  1. Blender Foundation: Blender 3.0 ist da
    Blender Foundation
    Blender 3.0 ist da

    Die freie 3D-Software Blender bekommt ein Update - wir haben es uns angesehen.
    Von Martin Wolf

  2. 4 Motoren und 4-Rad-Lenkung: Tesla aktualisiert Cybertruck
    4 Motoren und 4-Rad-Lenkung
    Tesla aktualisiert Cybertruck

    Tesla-Chef Elon Musk hat einige Änderungen am Cybertruck angekündigt. Der elektrische Pick-up-Truck wird mit vier Motoren ausgerüstet.

  3. DSIRF: Hackerbehörde Zitis prüft österreichischen Staatstrojaner
    DSIRF
    Hackerbehörde Zitis prüft österreichischen Staatstrojaner

    Deutsche Behörden sind mit mehreren Staatstrojaner-Herstellern im Gespräch. Nun ist ein weiterer mit Sitz in Wien bekanntgeworden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Advent: SanDisk Ultra 3D 1 TB 77€ • KFA2 Geforce RTX 3070 OC 8GB 1.019€ • Alternate (u. a. AKRacing Core SX 269,98€) • Sharkoon PureWriter RGB 44,90€ • Corsair K70 RGB MK.2 139,99€ • 2x Canton Plus GX.3 49€ • Gaming-Monitore günstiger (u. a. Samsung G3 27" 144Hz 219€) [Werbung]
    •  /