Alphazero: Einzelne KI ist bester Spieler in Go, Schach und Shogi

Deepminds Alphazero-KI konnte sich durch Trial and Error drei der bekanntesten Strategiebrettspiele selbst beibringen und die jeweiligen Meister deutlich besiegen - und die sind schon seit einiger Zeit keine Menschen mehr.

Artikel veröffentlicht am ,
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit.
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Forscher bei Googles Deepmind haben ein KI-System entwickelt, das drei klassische Brettspiele sehr gut beherrscht. Alphazero heißt die Software, welche in Go, Schach und der japanischen Schachvariate Shogi alle anderen Weltmeister in der jeweiligen Disziplin schlägt. Diese sind seit einiger Zeit keine Menschen mehr, sondern ebenfalls Künstliche Intelligenzen.

Alphazero musste beim Schach gegen Stockfish, bei Shogi gegen Elmo und bei Go gegen das hauseigene Programm Alphago antreten. Das Besondere am neuen System ist, dass ihm nur die jeweiligen Spielregeln beigebracht wurden. Als neuronales Netzwerk spielte die Software zunächst gegen sich selbst und prägte sich zufällig generierte Züge und deren beste Reaktionen genau ein. Dieses Trial-and-Error-Prinzip nennt sich auch Reinforcement Learning. Mithilfe von 5.000 spezialisierten Tensor Processing Units dauerte das Modelltraining bei Schach neun Stunden, bei Shogi zwölf Stunden und bei Go ganze 13 Tage.

Trial and Error statt vorprogrammierter Züge

Der Unterschied zu bisher eingesetzten Programmen ist, dass diese aus vielen manuell erstellten Zügen ihre eigenen Spielschritte durchführen. Dazu wurden auch professionelle menschliche Spieler zur Hilfe herangezogen. Alphazero konnte durch die enorme Rechenleistung allerdings wesentlich mehr Züge berechnen und hat daher ein größeres taktisches Repertoire. "Es ist so, als würde man die geheimen Notizen eines großartigen Spielers aus der Vergangenheit entdecken", beschreiben die Profispieler Natasha Regan und Matthew Sadler die Spielweise von Alphazero.

Die Ergebnisse der Partien sind recht eindeutig: Je nach Figurenfarbe gewinnt Alphazero beim Schach gegen Stockfish in 29 Prozent der Fälle und verliert zu 0,4 Prozent. Beginnt Alphazero mit den schwarzen Figuren, gewinnt es nur noch zu 2 Prozent und verliert zu etwa 0,8 Prozent. Bei Schach ist der Anteil der Remis-Situationen sehr hoch: 70,6 Prozent für weiß und 97,2 Prozent für schwarz.

Bei Shogi schlägt Alphazero den Kontrahenten Elmo sehr eindeutig: Auf der weißen Spielseite ist die Software zu 84,2 Prozent und auf der schwarzen zu 98,2 Prozent siegreich. Im japanischen Schach beginnt die Farbe Schwarz das Spiel. Bei Go gegen Deepminds Alphago sind es 86,9 Prozent Siege mit den weißen und 53,7 Gewinnerquote mit den schwarzen Linsen.

Für Software sind die drei getesteten Strategiespiele eine sehr gut zu bewältigende Aufgabe. Es wird abwechselnd nach sehr festen Zugregeln gespielt. Äußere Einflüsse gibt es nicht. Die Suchbaummethode Monte-Carlo Tree Search (MCTS) ist ein großer Vorteil, den die Konkurrenzprodukte nicht haben - genauso wenig wie viele Züge, die laut Deepmind Profispieler bisher nie zuvor gesehen haben und die Alphazero durch Millionen von Testläufen evaluiert und gespeichert hat.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


honis56 06. Jun 2019

Skat ist für KI schwieriger als Go, da es einen dritten Spielpartner gibt, auf dessen...

vonwegen 09. Dez 2018

Die Abgrenzung zu AlphaGo wird für mich nicht ganz deutlich. Man könnte nach dem Lesen z...

wlorenz65 08. Dez 2018

Das ist ja nur Text. Wer Chatbots sät, wird Chatbots ernten. Die können dann zwar...

Anonymer Nutzer 07. Dez 2018

Du bist ja voll der Blicker :-)



Aktuell auf der Startseite von Golem.de
Arbeitsmarktstudie
Die Schweiz als Einkommensparadies für ITler

Mit einem Umzug aus Deutschland in die Schweiz können IT-Fachkräfte ihr Einkommen von einem auf den anderen Tag verdoppeln. Dann können sie sich auch ihren größten beruflichen Wunsch leisten: die 4-Tage-Woche.
Von Peter Ilg

Arbeitsmarktstudie: Die Schweiz als Einkommensparadies für ITler
Artikel
  1. Militär: China gelingt Durchbruch bei Abwehr von Hyperschallraketen
    Militär
    China gelingt Durchbruch bei Abwehr von Hyperschallraketen

    Das Shanghai Institute of Mechanical and Electrical Engineering hat einen Durchbruch bei der Erforschung eines Abwehrsystems für Hyperschallwaffen erzielt.

  2. Windows: Berliner Verwaltung nutzt Server ohne Sicherheitsupdate
    Windows
    Berliner Verwaltung nutzt Server ohne Sicherheitsupdate

    Die Berliner Verwaltung nutzt Windows-Server, die keine Sicherheitsupdates mehr bekommen - obwohl ein Austausch schon länger geplant gewesen ist.

  3. HPC-Mythen: Es gibt keine Silberkugel beim Hochleistungsrechnen
    HPC-Mythen
    Es gibt keine Silberkugel beim Hochleistungsrechnen

    Revolutionieren Quantencomputer, neue Beschleuniger oder Programmiersprachen die Hochleistungsrechner? Eine Gruppe von Experten sagt: nein.
    Von Johannes Hiltscher

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AMD CPU kaufen, SW Jedi Survivor gratis dazu • Philips LED TV 65" 120 Hz Ambilight 999€ • KF DDR4-3600 32GB 91,89€ • Asus Mainboard 279€ • Bosch Prof. bis -55% • PCGH Cyber Week • Acer Predator 32" WQHD 170Hz 529€ • Philips Hue bis -50% • Asus Gaming-Laptops bis -25% [Werbung]
    •  /