Abo
  • Services:
Anzeige
Auch KI kann nun Prügelorgien in Knuddelgrafik spielen.
Auch KI kann nun Prügelorgien in Knuddelgrafik spielen. (Bild: Nintendo)

Gutes Lernen, schlechtes Lernen und Eigen-KO

So zeigte sich bei zwei unterschiedlichen getesteten Methoden zum Lernen, dass der eine Algorithmus (Actor-Critic) beim Training gegen die KI des Spiels am Ende so agierte, wie dies von Menschen zu erwarten sei. Der zweite Algorithmus (Q-Learning) nutzte dagegen eine Schwäche des Spiels und konnte durch Eigen-KO des Gegners gewinnen, was dauerhaft reproduzierbar war. Beide Algorithmen konnten aber noch einfach von menschlichen Spielern geschlagen werden.

Anzeige

Deshalb hat das Team in Anlehnung an die Vorgehensweise von Alpha Go seine Algorithmen gegen alte Versionen ihrer selbst antreten lassen. Damit war das Netzwerk schließlich in der Lage, nicht nur gegen menschliche Spieler mit Erfahrung in SSBM zu gewinnen, sondern auch gegen jene, die von der Spieler-Community als professionell und damit besonders gut eingeschätzt werden.

Doch auch diese Version des Algorithmus hatte große Schwierigkeiten damit, auf unerwartete Aktionen seiner Gegner reagieren zu können. Einem von den Autoren der Untersuchung als besonders clever bezeichneter Spieler ist es etwa mit einem Trick gelungen, den Actor-Critic-Algorithmus zum Verzicht auf einen Angriff zu zwingen und letztlich ebenfalls in ein Eigen-KO zu treiben.

Derartige Probleme hat das Team versucht zu überwinden, indem mittels verschiedener Spielcharaktere voneinander unabhängige neuronale Netze trainiert worden sind, die dann wiederum gegeneinander angetreten sind. Zuvor ist immer nur ein einzelner Charakter genutzt worden. So konnten die Algorithmen besser auf unerwartete Situationen reagieren.

KI ohne Erinnerung

Im Gegensatz zu Menschen, die kontinuierlich Reize aufnehmen, diese verarbeiten und in Reaktionen überführen können, kann das trainierte neuronale Netz immer nur auf einen einzelnen Zustand im Spiel reagieren. Dem Algorithmus fehlt damit sozusagen das Gedächtnis, um auf einen bestimmten Spielverlauf reagieren zu können.

Zwar gibt es mit den rekurrenten neuronalen Netzwerken (RNN) die Möglichkeit, diese Art Gedächtnis als eigenen Zustand zu emulieren, mit dem das Ergebnis einer Aktion direkt wieder in das Netz eingespeist wird. Dem Team gelang es in seiner Untersuchung jedoch nicht, ein fähiges RNN zu trainieren.

Ein RNN mit dem Gedächtnis könnte im Fall von SSBM künftig dazu genutzt werden, mit der eingangs erwähnten Zeitverzögerung umgehen zu können, die wie erwähnt in dem Spiel eine große Rolle einnimmt. Ebenso wäre ein RNN in der Lage, auch Geschosse, die in SSBM vorkommen, zu beurteilen und eventuell sogar selbst zu verwenden, indem deren Flugbahn bestimmt wird.

 Deep Learning: Wenn die KI besser prügelt als Menschen

eye home zur Startseite
violator 24. Feb 2017

Zufällig ja, aber eben ohne Taktik oder Gedanken. Da wird immer nur analysiert und...

JayJay15 24. Feb 2017

Es gibt doch nur 2 mögliche Entwicklungen im Bereich der KI. Ich bin nicht einer dieser...

Polinda Panda 24. Feb 2017

Vielleicht haben haben sie Spass am Spiel ...

Smincke 24. Feb 2017

In Melee ist Techskill wesentlich wichtiger als in den anderen Smash Teilen. Ein gut...



Anzeige

Stellenmarkt
  1. Ratbacher GmbH, Raum Köln
  2. über ACADEMIC WORK, München
  3. über Gfeller Consulting & Partner AG, Region Schaffhausen (Schweiz)
  4. Bundeskriminalamt, Wiesbaden


Anzeige
Blu-ray-Angebote
  1. (u. a. Hobbit Trilogie Blu-ray 43,89€ und Batman Dark Knight Trilogy Blu-ray 17,99€)
  2. (u. a. Reign, Person of Interest, Gossip Girl, The Clone Wars)
  3. (u. a. The Revenant 7,97€, James Bond Spectre 7,97€, Der Marsianer 7,97€)

Folgen Sie uns
       


  1. Quantenalgorithmen

    "Morgen könnte ein Physiker die Quantenmechanik widerlegen"

  2. Astra

    ZDF bleibt bis zum Jahr 2020 per Satellit in SD verfügbar

  3. Kubic

    Opensuse startet Projekt für Container-Plattform

  4. Frühstart

    Kabelnetzbetreiber findet keine Modems für Docsis 3.1

  5. Displayweek 2017

    Die Display-Welt wird rund und durchsichtig

  6. Autonomes Fahren

    Neues Verfahren beschleunigt Tests für autonome Autos

  7. Künstliche Intelligenz

    Alpha Go geht in Rente

  8. Security

    Telekom-Chef vergleicht Cyberangriffe mit Landminen

  9. Anga

    Kabelnetzbetreiber wollen schnelle Analogabschaltung

  10. Asus

    Das Zenbook Flip S ist 10,9 mm flach



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

XPS 13 (9365) im Test: Dells Convertible zeigt alte Stärken und neue Schwächen
XPS 13 (9365) im Test
Dells Convertible zeigt alte Stärken und neue Schwächen
  1. Prozessor Intel wird Thunderbolt 3 in CPUs integrieren
  2. Schnittstelle Intel pflegt endlich Linux-Treiber für Thunderbolt
  3. Atom C2000 & Kaby Lake Updates beheben Defekt respektive fehlendes HDCP 2.2

Calliope Mini im Test: Neuland lernt programmieren
Calliope Mini im Test
Neuland lernt programmieren
  1. Arduino Cinque RISC-V-Prozessor und ESP32 auf einem Board vereint
  2. MKRFOX1200 Neues Arduino-Board erscheint mit kostenlosem Datentarif
  3. Creoqode 2048 Tragbare Spielekonsole zum Basteln erhältlich

  1. Re: Künstliche Intelligenz

    Linkk | 15:31

  2. Re: Das Legen wird aber teurer sein. Auch das...

    oxybenzol | 15:30

  3. Hoffentlich gehen die alle insolvent!

    WalterWhite | 15:26

  4. Re: Geht einfacher.

    Der Held vom... | 15:26

  5. Irgendwie unstimmig

    Ovaron | 15:25


  1. 14:21

  2. 13:56

  3. 12:54

  4. 12:41

  5. 11:58

  6. 11:25

  7. 10:51

  8. 10:50


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel