Abo
  • Services:

Künstliche Intelligenz: Microsoft-Tochter schafft 999.990 Punkte in Ms. Pac-Man

Maluuba ist es gelungen, eine künstliche Intelligenz so weit zu trainieren, dass sie viermal mehr Punkte schafft als ein menschlicher Spieler. Allerdings gibt es auch Kritik, denn die KI hat nicht alles lernen müssen, sondern Bewertungen vorgesetzt bekommen. Und die Rekordangabe für Menschen stimmt auch nicht.

Artikel veröffentlicht am ,
Maluuba löst Ms. Pac-Man.
Maluuba löst Ms. Pac-Man. (Bild: Maluuba)

Microsofts Tochter Maluuba, ein Deep-Learning-Startup, hat eine KI entwickelt, die es schafft, Ms. Pac-Man bis zu seinem Limit auszureizen. 999.990 Punkte schaffte das Unternehmen in dem alten Atari-2600-Spiel aus den 1980er Jahren. Auch wenn das Spiel ein Klassiker ist: Es ist weiterhin ein komplexer Titel, der für Menschen nicht einfach zu handhaben ist. Der Rekord in dem Spiel liegt allerdings schon recht nahe am Maximum. Abdner Ashman schaffte schon 2005 einen Punktestand von 921.360. Einen Rekord, den er ein Jahr später noch einmal brach. Maluuba selbst gibt einen deutlich niedrigeren menschlichen Rekord in seinem Papier an. Er soll bei 266.000 Punkten liegen und auf Basis einer Emulation entstanden sein.

Stellenmarkt
  1. Leica Microsystems CMS GmbH, Mannheim
  2. Robert Bosch GmbH, Renningen

Ein durchschnittlicher Spieler kann von solchen Punktezahlen natürlich nur träumen. Die erreichten Werte sind also trotzdem beeindruckend. Um das Spiel zu gewinnen, hat Maluuba die Probleme in viele kleine Probleme zerlegt. Das soll der eigentliche Erfolg sein. Dass Ms. Pac-Man dabei gewonnen wurde, ist nur ein Nebeneffekt. Die einzelnen Probleme werden von sogenannten KI-Agenten einzeln betrachtet und bewertet. Das Verfahren soll sich später auf andere Problemlösungen anwenden lassen. Insgesamt 150 dieser Agenten kamen zum Einsatz, die entsprechend für Erfolge belohnt wurden. Einige beachteten Belohnungen auf dem Spielfeld, andere Gegner und wieder andere achteten auf die verbliebene Anzahl an Leben.

Vorgefertigte Werte helfen der KI

Doch nicht alles wurde von diesen Agenten gelernt, wie aus einer tiefergehenden, recht harschen Kritik einer Analyse von The Register hervorgeht. Das Problem sind nämlich die Belohnungen, die die Agenten jeweils bekommen. Diese sind fest einprogrammiert worden. Die Agenten selbst lernen noch nicht, wie stark die Konsequenzen eines Auftreffens mit einem Gegner ist. Die KI wurde also mit Vorwissen ausgestattet. Maluuba arbeitet laut Register allerdings daran, auf dieses Vorwissen verzichten zu können. Allerdings lernt auch ein Mensch die Konsequenzen in Teilen zuvor, indem er etwa die Anleitung studiert. Die Bewertung der Konsequenzen folgt allerdings erst beim Spielen.

Maluuba hat ein Video des Spielens veröffentlicht und erreicht 999.990 Punkte nach einer Stunde und 16 Minuten.



Anzeige
Spiele-Angebote
  1. (-35%) 38,99€
  2. (-50%) 29,99€
  3. 19,99€

Arglborps 16. Jun 2017

Und da soll nochmal einer sagen Microsoft Systeme seien nur zum Spielen gut! Da&#8230...

marcel151 15. Jun 2017

Ich glaube das stimmt nicht ganz mit eine Stunde 16 Minuten, da es 3 mal so schnell...


Folgen Sie uns
       


Golem.de bastelt, spielt und entdeckt Nintendo Labo

Nintendo Labo soll mehr sein als eine neue Videospielmarke. Auf dem Anspiel-Event in Hamburg haben wir gebastelt, gespielt und die Funktionsweise von Karton-Klavier bis Robo-Rucksack erkundet.

Golem.de bastelt, spielt und entdeckt Nintendo Labo Video aufrufen
Blue Byte: Auf dem Weg in schöner generierte Welten
Blue Byte
Auf dem Weg in schöner generierte Welten

Quo Vadis Gemeinsam mit der Universität Köln arbeitet Ubisoft Blue Byte an neuen Technologien für prozedural generierte Welten. Producer Marc Braun hat einige der neuen Ansätze vorgestellt.

  1. Influencer Fortnite schlägt Minecraft
  2. Politik in Games Zwischen Völkerfreundschaft und Präsidentenprügel
  3. Förderung Spielebranche will 50 Millionen Euro vom Steuerzahler

Thermalright ARO-M14 ausprobiert: Der den Ryzen kühlt
Thermalright ARO-M14 ausprobiert
Der den Ryzen kühlt

Mit dem ARO-M14 bringt Thermalright eine Ryzen-Version des populären HR-02 Macho Rev B. Der in zwei Farben erhältliche CPU-Kühler leistet viel und ist leise, zudem hat Thermalright die Montage etwas verbessert.
Ein Hands on von Marc Sauter


    Datenschutz: Der Nutzer ist willig, doch die AGB sind schwach
    Datenschutz
    Der Nutzer ist willig, doch die AGB sind schwach

    Verbraucher verstehen die Texte oft nicht wirklich, in denen Unternehmen erklären, wie ihre Daten verarbeitet werden. Datenschutzexperten und -forscher suchen daher nach praktikablen Lösungen.
    Ein Bericht von Christiane Schulzki-Haddouti

    1. Datenskandal Bundesregierung erwägt strenge Facebook-Regulierung
    2. Quartalsbericht Facebook macht fast 5 Milliarden US-Dollar Gewinn
    3. Soziales Netzwerk Facebook ermöglicht Einsprüche gegen Löschungen

      •  /