Machine Learning: Deepmind-KI soll 600 verschiedene Aufgaben meistern können

KI-Modelle sind oft nur für einen Zweck trainiert. Deepminds Gato hingegen soll Atari spielen, Texte lesen und Roboter steuern können.

Artikel veröffentlicht am ,
Das KI-Modell Gato, auf deutsch Katze, soll hunderte Aufgaben erfüllen können.
Das KI-Modell Gato, auf deutsch Katze, soll hunderte Aufgaben erfüllen können. (Bild: Christopher Furlong/Getty Images)

Eine der wohl schwierigsten Aufgaben der modernen Forschung an sogenannter Künstlicher Intelligenz ist es, Systeme zu erschaffen, die mehr als nur eine bestimmte Aufgabe umsetzen können: Also nicht nur Texte erstellen, Bilder erkennen oder ein Computerspiel spielen, sondern alles zusammen. Mit dem Modell Gato hat das Google-Schwesterunternehmen Deepmind genau solch ein System erstellt.

Stellenmarkt
  1. Mitarbeiter (m/w/d) im 1st und 2nd Level IT-Support
    FPS Consult GmbH, Frankfurt
  2. IT / Cyber Security Analyst (m/w/d)
    8com GmbH & Co. KG., Neustadt
Detailsuche

Laut der Forschungsarbeit zu Gato (PDF) ist das System mit 604 verschiedenen Aufgaben "mit unterschiedlichen Modalitäten, Beobachtungen und Handlungsvorgaben" trainiert worden. Der KI-Agent arbeite dabei nicht nur multimodal, sondern auch mit Multitasking.

Zu den Fähigkeiten heißt es: "Dasselbe Netzwerk mit denselben Gewichten kann Atari spielen, Bilder beschriften, chatten, Blöcke mit einem echten Roboterarm stapeln und vieles mehr, wobei es je nach Kontext entscheidet, ob es Text, Gelenkmomente, Tastendrücke oder andere Token ausgibt."

Multi-Tasking mit nur 1,2 Milliarden Parametern

KI-Systeme, die mehrere Eingaben verarbeiten können, sind dabei nichts Ungewöhnliches. So kann etwa die Google-Suche Text und Bilder verknüpfen, um Ergebnisse zu erzielen. Das Besondere an Gato ist jedoch die Fülle an sehr unterschiedlichen Aufgaben, die das System je nach Eingabe selbständig umsetzen können soll.

Golem Karrierewelt
  1. DP-203 Data Engineering on Microsoft Azure virtueller Vier-Tage-Workshop
    12.-15.09.2022, virtuell
  2. Angular für Einsteiger: virtueller Zwei-Tage-Workshop
    26./27.09.2022, Virtuell
Weitere IT-Trainings

Hinzu kommt, dass Gato derzeit nur rund 1,2 Milliarden Parameter umfassen soll. Das entspräche dem derzeitigen Stand der Technik zum Steuern von Robotern. Im Vergleich zu aktuellen riesigen Sprachmodellen mit 540 Milliarden Parametern wie Googles Palm ist das KI-System also vergleichsweise sehr klein.

Gato kann nur wenige Aufgaben wirklich gut

Zum Training schreibt das Team: "Gato wird anhand einer großen Anzahl von Datensätzen trainiert, die die Erfahrungen der Agenten in simulierten und realen Umgebungen sowie eine Vielzahl von Datensätzen zu natürlicher Sprache und Bildern umfassen."

Die Leistung von Gato bei der Fülle der Aufgaben ist dabei sehr unterschiedlich. Als Chatbot gebe das System etwa oft oberflächliche oder gar faktisch falsche Antworten. So beantwortet Gato die Frage nach der Hauptstadt von Frankreich mit Marseille.

In nur 450 der rund 600 Aufgaben liefere Gato dabei in 50 Prozent der Fälle eine Leistung, die vergleichbar mit menschlichen Experten auf dem Gebiet ist. Besonders gut schneidet Gato im 3D-Puzzlen des DM Lab ab. In Aufgaben wie den eher simpel wirkenden Atari-Spielen dagegen hinkt Gato nicht nur teils Menschen, sondern vor allem auch speziell trainierter KI hinterher. Deepmind hofft, derartige Problem durch einen anderen Trainingsansatz künftig noch lösen zu können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


glmuser 17. Mai 2022 / Themenstart

Du weißt dass die Fülle an Parametern die Rechenleistung beim Inferieren massiv...

mhstar 16. Mai 2022 / Themenstart

Naja, das Ding ist halt spezialisiert. Ist bei den Menschen auch nicht anders. Manche tun...

Kommentieren



Aktuell auf der Startseite von Golem.de
Kosmologie
Im Weltraum hört dich niemand knallen

Die kosmische Hintergrundstrahlung wird gerne als das "Echo des Urknalls" bezeichnet. Dabei ist sie weder beim Urknall entstanden noch ist sie ein Echo. Zeit für eine Klarstellung.
Von Helmut Linde

Kosmologie: Im Weltraum hört dich niemand knallen
Artikel
  1. Photovoltaik: Tesla zeigt Solar-Anhänger mit Starlink-Antenne
    Photovoltaik
    Tesla zeigt Solar-Anhänger mit Starlink-Antenne

    Tesla hat auf der Ideenexpo in Hannover einen Anhänger mit ausfahrbaren Photovoltaik-Modulen nebst Starlink-Antenne vorgestellt.

  2. Kryptogeld: Auch Kryptobroker Voyager Digital meldet Insolvenz an
    Kryptogeld
    Auch Kryptobroker Voyager Digital meldet Insolvenz an

    Die Marktentwicklung und die Pleite von Three Arrows Capital haben dem Krypto-Broker Voyager Digital schwer zugesetzt.

  3. Layouten mit LaTex: Setzt du noch oder gestaltest du schon?
    Layouten mit LaTex
    Setzt du noch oder gestaltest du schon?

    LaTex bietet viele Möglichkeiten, Briefe durch Schriftarten, Buchstabenbreiten und spezielle Kopf- und Fußzeilen besonders aussehen zu lassen.
    Eine Anleitung von Uwe Ziegenhagen

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bestellbar • EVGA RTX 3090 24G günstig wie nie: 1.649€ • MindStar (MSI RTX 3060 429€, MSI Optix 31,5“ WQHD 165Hz 369€) • Samsung QLED 85" günstig wie nie: 1.732,72€ • Alternate (Tower-Gehäuse & CPU-Kühler v. Raijintek) • Der beste 2.000€-Gaming-PC • LG TV 65" 120Hz -56% [Werbung]
    •  /