Alphazero: Einzelne KI ist bester Spieler in Go, Schach und Shogi

Deepminds Alphazero-KI konnte sich durch Trial and Error drei der bekanntesten Strategiebrettspiele selbst beibringen und die jeweiligen Meister deutlich besiegen - und die sind schon seit einiger Zeit keine Menschen mehr.

Artikel veröffentlicht am ,
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit.
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Forscher bei Googles Deepmind haben ein KI-System entwickelt, das drei klassische Brettspiele sehr gut beherrscht. Alphazero heißt die Software, welche in Go, Schach und der japanischen Schachvariate Shogi alle anderen Weltmeister in der jeweiligen Disziplin schlägt. Diese sind seit einiger Zeit keine Menschen mehr, sondern ebenfalls Künstliche Intelligenzen.

Stellenmarkt
  1. IT-Administrator*in (m/w/d)
    Possehl Spezialbau GmbH, Sprendlingen (Home-Office)
  2. Software & Data Engineer / Machine Learning Engineer (m/w/d)
    h.a.l.m. elektronik GmbH, Frankfurt
Detailsuche

Alphazero musste beim Schach gegen Stockfish, bei Shogi gegen Elmo und bei Go gegen das hauseigene Programm Alphago antreten. Das Besondere am neuen System ist, dass ihm nur die jeweiligen Spielregeln beigebracht wurden. Als neuronales Netzwerk spielte die Software zunächst gegen sich selbst und prägte sich zufällig generierte Züge und deren beste Reaktionen genau ein. Dieses Trial-and-Error-Prinzip nennt sich auch Reinforcement Learning. Mithilfe von 5.000 spezialisierten Tensor Processing Units dauerte das Modelltraining bei Schach neun Stunden, bei Shogi zwölf Stunden und bei Go ganze 13 Tage.

Trial and Error statt vorprogrammierter Züge

Der Unterschied zu bisher eingesetzten Programmen ist, dass diese aus vielen manuell erstellten Zügen ihre eigenen Spielschritte durchführen. Dazu wurden auch professionelle menschliche Spieler zur Hilfe herangezogen. Alphazero konnte durch die enorme Rechenleistung allerdings wesentlich mehr Züge berechnen und hat daher ein größeres taktisches Repertoire. "Es ist so, als würde man die geheimen Notizen eines großartigen Spielers aus der Vergangenheit entdecken", beschreiben die Profispieler Natasha Regan und Matthew Sadler die Spielweise von Alphazero.

Die Ergebnisse der Partien sind recht eindeutig: Je nach Figurenfarbe gewinnt Alphazero beim Schach gegen Stockfish in 29 Prozent der Fälle und verliert zu 0,4 Prozent. Beginnt Alphazero mit den schwarzen Figuren, gewinnt es nur noch zu 2 Prozent und verliert zu etwa 0,8 Prozent. Bei Schach ist der Anteil der Remis-Situationen sehr hoch: 70,6 Prozent für weiß und 97,2 Prozent für schwarz.

Bei Shogi schlägt Alphazero den Kontrahenten Elmo sehr eindeutig: Auf der weißen Spielseite ist die Software zu 84,2 Prozent und auf der schwarzen zu 98,2 Prozent siegreich. Im japanischen Schach beginnt die Farbe Schwarz das Spiel. Bei Go gegen Deepminds Alphago sind es 86,9 Prozent Siege mit den weißen und 53,7 Gewinnerquote mit den schwarzen Linsen.

Für Software sind die drei getesteten Strategiespiele eine sehr gut zu bewältigende Aufgabe. Es wird abwechselnd nach sehr festen Zugregeln gespielt. Äußere Einflüsse gibt es nicht. Die Suchbaummethode Monte-Carlo Tree Search (MCTS) ist ein großer Vorteil, den die Konkurrenzprodukte nicht haben - genauso wenig wie viele Züge, die laut Deepmind Profispieler bisher nie zuvor gesehen haben und die Alphazero durch Millionen von Testläufen evaluiert und gespeichert hat.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Raumfahrt
Astra startet mit großen Ambitionen Billigraketen in Alaska

Mit 250.000 US-Dollar sollen die Raketen von Astra zum Preis eines Sportwagens hergestellt werden können. Wie will die Firma das schaffen?
Von Frank Wunderlich-Pfeiffer

Raumfahrt: Astra startet mit großen Ambitionen Billigraketen in Alaska
Artikel
  1. Nvidia und Colorful: Das Grafikkartenmuseum eröffnet seine Pforten
    Nvidia und Colorful
    Das Grafikkartenmuseum eröffnet seine Pforten

    Colorful und Nvidia eröffnen bald ein Grafikkarten-Museum. Zu sehen sind Seltenheiten wie die erste Dual-GPU von ATI und die Geforce 256.

  2. Fifa, Battlefield und Co.: Der EA-Hack startete mit Cookies für 10 US-Dollar
    Fifa, Battlefield und Co.
    Der EA-Hack startete mit Cookies für 10 US-Dollar

    Die Hacking-Gruppe erklärt dem Magazin Motherboard Schritt für Schritt, wie der Hack auf EA gelang. Die primäre Fehlerquelle: der Mensch.

  3. Onlinetickets: 17-Jähriger betrügt Bahn um 270.000 Euro
    Onlinetickets
    17-Jähriger betrügt Bahn um 270.000 Euro

    Mit illegal erworbenen Onlinetickets soll ein 17-Jähriger die Bahn um 270.000 Euro geprellt haben. Entdeckt wurde er nur durch Zufall.

honis56 06. Jun 2019

Skat ist für KI schwieriger als Go, da es einen dritten Spielpartner gibt, auf dessen...

vonwegen 09. Dez 2018

Die Abgrenzung zu AlphaGo wird für mich nicht ganz deutlich. Man könnte nach dem Lesen z...

wlorenz65 08. Dez 2018

Das ist ja nur Text. Wer Chatbots sät, wird Chatbots ernten. Die können dann zwar...

Anonymer Nutzer 07. Dez 2018

Du bist ja voll der Blicker :-)

henryanki 07. Dez 2018

Falsch. Der Software die Regeln beizubringen --> einfach. Das Spiel meistern --> au...


Folgen Sie uns
       


  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Alternate (u. a. MSI Optix 27" WQHD/165 Hz 315,99€ und Fractal Design Vector RS Blackout Dark TG 116,89€) • Fractal Design Define S2 Black 99,90€ • Intel i9-11900 379€ • EPOS Sennheiser GSP 600 149€ • Amazon: PC-Spiele reduziert (u. a. C&C: Remastered Collection 9,99€) [Werbung]
    •  /