Künstliche Intelligenz: Microsoft-Tochter schafft 999.990 Punkte in Ms. Pac-Man

Maluuba ist es gelungen, eine künstliche Intelligenz so weit zu trainieren, dass sie viermal mehr Punkte schafft als ein menschlicher Spieler. Allerdings gibt es auch Kritik, denn die KI hat nicht alles lernen müssen, sondern Bewertungen vorgesetzt bekommen. Und die Rekordangabe für Menschen stimmt auch nicht.

Artikel veröffentlicht am ,
Maluuba löst Ms. Pac-Man.
Maluuba löst Ms. Pac-Man. (Bild: Maluuba)

Microsofts Tochter Maluuba, ein Deep-Learning-Startup, hat eine KI entwickelt, die es schafft, Ms. Pac-Man bis zu seinem Limit auszureizen. 999.990 Punkte schaffte das Unternehmen in dem alten Atari-2600-Spiel aus den 1980er Jahren. Auch wenn das Spiel ein Klassiker ist: Es ist weiterhin ein komplexer Titel, der für Menschen nicht einfach zu handhaben ist. Der Rekord in dem Spiel liegt allerdings schon recht nahe am Maximum. Abdner Ashman schaffte schon 2005 einen Punktestand von 921.360. Einen Rekord, den er ein Jahr später noch einmal brach. Maluuba selbst gibt einen deutlich niedrigeren menschlichen Rekord in seinem Papier an. Er soll bei 266.000 Punkten liegen und auf Basis einer Emulation entstanden sein.

Stellenmarkt
  1. IT Service Delivery Manager (m/w/d)
    nora systems GmbH, Weinheim
  2. PHP Developer / Full-Stack Developer (x/w/m)
    Plan Software GmbH, Saarbrücken
Detailsuche

Ein durchschnittlicher Spieler kann von solchen Punktezahlen natürlich nur träumen. Die erreichten Werte sind also trotzdem beeindruckend. Um das Spiel zu gewinnen, hat Maluuba die Probleme in viele kleine Probleme zerlegt. Das soll der eigentliche Erfolg sein. Dass Ms. Pac-Man dabei gewonnen wurde, ist nur ein Nebeneffekt. Die einzelnen Probleme werden von sogenannten KI-Agenten einzeln betrachtet und bewertet. Das Verfahren soll sich später auf andere Problemlösungen anwenden lassen. Insgesamt 150 dieser Agenten kamen zum Einsatz, die entsprechend für Erfolge belohnt wurden. Einige beachteten Belohnungen auf dem Spielfeld, andere Gegner und wieder andere achteten auf die verbliebene Anzahl an Leben.

Vorgefertigte Werte helfen der KI

Doch nicht alles wurde von diesen Agenten gelernt, wie aus einer tiefergehenden, recht harschen Kritik einer Analyse von The Register hervorgeht. Das Problem sind nämlich die Belohnungen, die die Agenten jeweils bekommen. Diese sind fest einprogrammiert worden. Die Agenten selbst lernen noch nicht, wie stark die Konsequenzen eines Auftreffens mit einem Gegner ist. Die KI wurde also mit Vorwissen ausgestattet. Maluuba arbeitet laut Register allerdings daran, auf dieses Vorwissen verzichten zu können. Allerdings lernt auch ein Mensch die Konsequenzen in Teilen zuvor, indem er etwa die Anleitung studiert. Die Bewertung der Konsequenzen folgt allerdings erst beim Spielen.

Maluuba hat ein Video des Spielens veröffentlicht und erreicht 999.990 Punkte nach einer Stunde und 16 Minuten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Macbook Pro
Apple bestätigt High Power Mode für M1 Max

Käufer des Macbook Pro mit M1 Max können wohl in MacOS Monterey per Klick noch mehr Leistung aus dem Gerät herausholen.

Macbook Pro: Apple bestätigt High Power Mode für M1 Max
Artikel
  1. Bundesregierung: Autobahn App 2.0 im ersten Quartal 2022 geplant
    Bundesregierung
    Autobahn App 2.0 im ersten Quartal 2022 geplant

    Die Opposition kritisiert die massiven Kosten, Nutzer bewerten die App schlecht. Dennoch soll die Autobahn App nun erweitert werden.

  2. Klage: Google soll E-Privacy und Werbemarkt manipuliert haben
    Klage
    Google soll E-Privacy und Werbemarkt manipuliert haben

    Mehrere US-Bundesstaaten haben Klage gegen Google eingereicht. Das Unternehmen rühmt sich derweil, Regulierungen verlangsamt zu haben.

  3. Silence S04: Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt
    Silence S04
    Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt

    Beim Elektroauto Silence S04 kann der Nutzer den Akku selbst wechseln, wenn dieser leergefahren ist.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Gutscheinheft mit Direktabzügen und Zugaben • Nur noch heute: Mehrwertsteuer-Aktion bei MediaMarkt • Roccat Suora 43,99€ • Razer Goliathus Extended Chroma Mercury ab 26,99€ • Seagate SSDs & HDDs günstiger • Alternate (u. a. ASUS ROG Strix Z590-A Gaming WIFI 258€) [Werbung]
    •  /