• IT-Karriere:
  • Services:

Deep Learning: Wenn die KI besser prügelt als Menschen

In linearen Jump-'n'-Run-Spielen sind Maschinen schon lange besser als Menschen. In vergleichsweise hochkomplexen Multiplayer-Spielen wie Super Smash Bros. Melee kann KI nun aber auch Menschen übertrumpfen. Noch haben Menschen aber einen entscheidenden Vorteil.

Artikel veröffentlicht am ,
Auch KI kann nun Prügelorgien in Knuddelgrafik spielen.
Auch KI kann nun Prügelorgien in Knuddelgrafik spielen. (Bild: Nintendo)

Mit Super Smash Bros. Melee (SSBM) hat Nintendo vor rund 15 Jahren das wohl meistverkaufte Spiel für den Gamecube veröffentlicht und das Spiel erfreut sich wegen dessen komplexer Anforderungen nach wie vor großer Beliebtheit. Ein Forscherteam vom MIT und der NYU hat sich daran probiert, künstliche Intelligenz (KI) auf das Spiel für SSBM zu trainieren. Seine Untersuchung hat das Team auf Arxiv.org vorveröffentlicht. Demnach hat es dabei nicht nur erwartbare Probleme gegeben, dem Team ist es in Teilen sogar gelungen, tatsächlich Profi-Spieler zu schlagen.

Inhalt:
  1. Deep Learning: Wenn die KI besser prügelt als Menschen
  2. Gutes Lernen, schlechtes Lernen und Eigen-KO

Dass Letzteres möglich ist, war nicht unbedingt zu erwarten. Zwar werden verschiedene Methoden des sogenannten maschinellen Lernens schon länger genutzt, um KI in Computerspielen zu testen - teils auch mit extrem beeindruckenden und klar übermenschlichen Ergebnissen. Doch das Multiplayer-Spiel SSBM setzt sehr komplexe Dynamiken der Spieler voraus, die teilweise auch gar nicht mehr wahrgenommen werden können. SSBM ist damit viel mehr als nur eine lustige Prügel-Orgie mit Comic-Figuren und übersteigt etwa die Anforderungen bisher getesteter linearer Jump-'n'-Run-Spiele von Atari oder Nintendo.

Fast zu viele Möglichkeiten für die Maschine

Bei einigen Aktionen verfügt SSBM etwa über eine erzwungene Verzögerung der Eingaben, die teils mehrere Frames umfasst. Ebenso gibt es Aktionen, die innerhalb von höchstens zwei Frames (rund 33ms) ausgelöst werden müssen. Bei 60 Bildern die Sekunde geht das deutlich über das für Menschen üblicherweise angenommene Reiz-Reaktions-Schema (200ms) hinaus.

Eigene Aktionen müssen also in Antizipation auf mögliche Aktionen des Gegners vor diesen geplant und ausgeführt werden. Auch der Erfolg einer Aktion lässt sich nur relativ zum Gegner und über einen bestimmten Zeitraum hinweg beurteilen. Letztlich können mit dem Gamecube-Controller auch so viele Eingaben getätigt werden, dass das Team für seine KI diese auf 54 Aktionen reduzieren mussten.

Paralleles Selbst-Lernen

Stellenmarkt
  1. Rödl & Partner, Nürnberg
  2. NÜRNBERGER Versicherung, Nürnberg

Um die KI zu trainieren, hat das Team die Methoden des sogenannten verstärkenden Lernens (Reinforcement Learning, RL) genutzt. Dabei erlernt die KI, hier ein neuronales Netzwerk, mehr oder weniger selbstständig eine Strategie zum Gewinnen auf Basis von Erfolg und Misserfolg im Spiel. Im Vergleich zu Atari-Spielen aus den 80er Jahren ist die Emulation des Gamecube mit SSBM aber wesentlich langsamer. Das Team hat sich deshalb dazu entschlossen, bis zu 50 Emulatoren parallel zu betreiben und diese zum Lernen zu nutzen.

Die so erhaltenen Ergebnisse, also das Erlernte selbst, werden damit aber asynchron zueinander erzeugt, was im Gegensatz zu bisherigen Annahmen zum RL in der Praxis allerdings keine Probleme bereite. Das System ist wohl immer noch schnell genug, die Ergebnisse der parallel laufenden Trainingsphase zu verteilen. Die Unterschiede seien dabei außerdem wohl klein genug, um das gesamte System nicht zu gefährden.

Die Eigenheiten des Spiels erschwerten die Trainingsphase aber enorm, weshalb diese immer wieder an andere Voraussetzungen angepasst werden musste. Aber auch nach diesem Fine-Tuning sind die Algorithmen im direkten Vergleich mit Menschen nicht immer gut genug.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Gutes Lernen, schlechtes Lernen und Eigen-KO 
  1. 1
  2. 2
  3.  


Anzeige
Hardware-Angebote
  1. 555,55€ (zzgl. Versandkosten)
  2. 399,00€ (Bestpreis! zzgl. Versand)
  3. (reduzierte Überstände, Restposten & Co.)
  4. (u. a. RTX 2080 ROG Strix Gaming Advanced für 699€, RTX 2080 SUPER Dual Evo OC für 739€ und...

violator 24. Feb 2017

Zufällig ja, aber eben ohne Taktik oder Gedanken. Da wird immer nur analysiert und...

JayJay15 24. Feb 2017

Es gibt doch nur 2 mögliche Entwicklungen im Bereich der KI. Ich bin nicht einer dieser...

Polinda Panda 24. Feb 2017

Vielleicht haben haben sie Spass am Spiel ...

Smincke 24. Feb 2017

In Melee ist Techskill wesentlich wichtiger als in den anderen Smash Teilen. Ein gut...


Folgen Sie uns
       


Blackmagic Pocket Cinema Camera 6k im Test

Die neue Pocket Cinema Camera 6k von Blackmagicdesign hat nur wenig mit DSLR-Kameras gemein. Die Kamera liefert Highend-Qualität, erfordert aber entsprechendes Profiwissen - und wir vermissen einige Funktionen.

Blackmagic Pocket Cinema Camera 6k im Test Video aufrufen
Mi Note 10 im Hands on: Fünf Kameras, die sich lohnen
Mi Note 10 im Hands on
Fünf Kameras, die sich lohnen

Mit dem Mi Note 10 versucht Xiaomi, der Variabilität von Huaweis Vierfachkameras noch eins draufzusetzen - mit Erfolg: Die Fünffachkamera bietet in fast jeder Situation ein passendes Objektiv, auch die Bildqualität kann sich sehen lassen. Der Preis dafür ist ein recht hohes Gewicht.
Ein Hands on von Tobias Költzsch

  1. Xiaomi Neues Redmi Note 8T mit Vierfachkamera kostet 200 Euro
  2. Mi Note 10 Xiaomis neues Smartphone mit 108 Megapixeln kostet 550 Euro
  3. Mi Watch Xiaomi bringt Smartwatch mit Apfelgeschmack

Social Engineering: Die Mitarbeiter sind unsere Verteidigung
Social Engineering
"Die Mitarbeiter sind unsere Verteidigung"

Prävention reicht nicht gegen Social Engineering und die derzeitigen Trainings sind nutzlos, sagt der Sophos-Sicherheitsexperte Chester Wisniewski. Seine Lösung: Mitarbeiter je nach Bedrohungslevel schulen - und so schneller sein als die Kriminellen.
Ein Interview von Moritz Tremmel

  1. Social Engineering Mit künstlicher Intelligenz 220.000 Euro erbeutet
  2. Social Engineering Die unterschätzte Gefahr

Definitive Editon angespielt: Das Age of Empires 2 für Könige
Definitive Editon angespielt
Das Age of Empires 2 für Könige

Die 27 Einzelspielerkampagnen sollen für rund 200 Stunden Beschäftigung sorgen, dazu kommen Verbesserungen bei der Grafik und Bedienung sowie eine von Grund auf neu programmierte Gegner- oder Begleit-KI: Die Definitive Edition von Age of Empires 2 ist erhältlich.


      •  /