• IT-Karriere:
  • Services:

Alphazero: Einzelne KI ist bester Spieler in Go, Schach und Shogi

Deepminds Alphazero-KI konnte sich durch Trial and Error drei der bekanntesten Strategiebrettspiele selbst beibringen und die jeweiligen Meister deutlich besiegen - und die sind schon seit einiger Zeit keine Menschen mehr.

Artikel veröffentlicht am ,
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit.
Alphazero schlägt andere KIs und Menschen mit Leichtigkeit. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Forscher bei Googles Deepmind haben ein KI-System entwickelt, das drei klassische Brettspiele sehr gut beherrscht. Alphazero heißt die Software, welche in Go, Schach und der japanischen Schachvariate Shogi alle anderen Weltmeister in der jeweiligen Disziplin schlägt. Diese sind seit einiger Zeit keine Menschen mehr, sondern ebenfalls Künstliche Intelligenzen.

Stellenmarkt
  1. Greenpeace e.V., Hamburg
  2. VfB Stuttgart 1893 AG, Stuttgart

Alphazero musste beim Schach gegen Stockfish, bei Shogi gegen Elmo und bei Go gegen das hauseigene Programm Alphago antreten. Das Besondere am neuen System ist, dass ihm nur die jeweiligen Spielregeln beigebracht wurden. Als neuronales Netzwerk spielte die Software zunächst gegen sich selbst und prägte sich zufällig generierte Züge und deren beste Reaktionen genau ein. Dieses Trial-and-Error-Prinzip nennt sich auch Reinforcement Learning. Mithilfe von 5.000 spezialisierten Tensor Processing Units dauerte das Modelltraining bei Schach neun Stunden, bei Shogi zwölf Stunden und bei Go ganze 13 Tage.

Trial and Error statt vorprogrammierter Züge

Der Unterschied zu bisher eingesetzten Programmen ist, dass diese aus vielen manuell erstellten Zügen ihre eigenen Spielschritte durchführen. Dazu wurden auch professionelle menschliche Spieler zur Hilfe herangezogen. Alphazero konnte durch die enorme Rechenleistung allerdings wesentlich mehr Züge berechnen und hat daher ein größeres taktisches Repertoire. "Es ist so, als würde man die geheimen Notizen eines großartigen Spielers aus der Vergangenheit entdecken", beschreiben die Profispieler Natasha Regan und Matthew Sadler die Spielweise von Alphazero.

Die Ergebnisse der Partien sind recht eindeutig: Je nach Figurenfarbe gewinnt Alphazero beim Schach gegen Stockfish in 29 Prozent der Fälle und verliert zu 0,4 Prozent. Beginnt Alphazero mit den schwarzen Figuren, gewinnt es nur noch zu 2 Prozent und verliert zu etwa 0,8 Prozent. Bei Schach ist der Anteil der Remis-Situationen sehr hoch: 70,6 Prozent für weiß und 97,2 Prozent für schwarz.

Bei Shogi schlägt Alphazero den Kontrahenten Elmo sehr eindeutig: Auf der weißen Spielseite ist die Software zu 84,2 Prozent und auf der schwarzen zu 98,2 Prozent siegreich. Im japanischen Schach beginnt die Farbe Schwarz das Spiel. Bei Go gegen Deepminds Alphago sind es 86,9 Prozent Siege mit den weißen und 53,7 Gewinnerquote mit den schwarzen Linsen.

Für Software sind die drei getesteten Strategiespiele eine sehr gut zu bewältigende Aufgabe. Es wird abwechselnd nach sehr festen Zugregeln gespielt. Äußere Einflüsse gibt es nicht. Die Suchbaummethode Monte-Carlo Tree Search (MCTS) ist ein großer Vorteil, den die Konkurrenzprodukte nicht haben - genauso wenig wie viele Züge, die laut Deepmind Profispieler bisher nie zuvor gesehen haben und die Alphazero durch Millionen von Testläufen evaluiert und gespeichert hat.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

honis56 06. Jun 2019

Skat ist für KI schwieriger als Go, da es einen dritten Spielpartner gibt, auf dessen...

vonwegen 09. Dez 2018

Die Abgrenzung zu AlphaGo wird für mich nicht ganz deutlich. Man könnte nach dem Lesen z...

wlorenz65 08. Dez 2018

Das ist ja nur Text. Wer Chatbots sät, wird Chatbots ernten. Die können dann zwar...

Anonymer Nutzer 07. Dez 2018

Du bist ja voll der Blicker :-)

henryanki 07. Dez 2018

Falsch. Der Software die Regeln beizubringen --> einfach. Das Spiel meistern --> au...


Folgen Sie uns
       


Looking Glass Holo-Display angesehen (CES 2020)

Der Looking Glass 8K ist ein Monitor, der mittels Lichtfeldtechnologie 3D-Inhalte als Hologramm anzeigen kann. Golem.de hat sich das Display auf der CES 2020 genauer angeschaut.

Looking Glass Holo-Display angesehen (CES 2020) Video aufrufen
Verkehr: Das Kaltstart-Dilemma der Autos mit Hybridantrieb
Verkehr
Das Kaltstart-Dilemma der Autos mit Hybridantrieb

Bei Hybridautos und Plugin-Hybriden kommt es häufiger zu Kaltstarts als bei normalen Verbrennungsmotoren - wenn der Verbrennungsmotor ausgeht und der Elektromotor das Auto durch die Stadt schiebt. Wie schnell lässt sich der Katalysator vorwärmen, damit er Abgase dennoch gut reinigen kann?
Von Rainer Klose

  1. Elektromobilität Umweltbonus gilt auch für Jahreswagen
  2. Renault City K-ZE Dacia plant City-Elektroauto
  3. Elektroautos EU-Kommission billigt höheren Umweltbonus

Videostreaming: Was an Prime Video und Netflix nervt
Videostreaming
Was an Prime Video und Netflix nervt

Eine ständig anders sortierte Watchlist, ein automatisch startender Stream oder fehlende Markierungen für Aboinhalte: Oft sind es nur Kleinigkeiten, die den Spaß am Streaming vermiesen - eine Hassliste.
Ein IMHO von Ingo Pakalski

  1. WhatsOnFlix Smartphone-App für bessere Verwaltung der Netflix-Inhalte
  2. Netflix Staffel-2-Trailer zeigt Cyberpunk-Welt von Altered Carbon
  3. Videostreaming Netflix musste Night of the Living Dead entfernen

Alphakanal: Gimp verrät Geheimnisse in Bildern
Alphakanal
Gimp verrät Geheimnisse in Bildern

Wer in Gimp in einem Bild mit Transparenz Bildbereiche löscht, der macht sie nur durchsichtig. Dieses wenig intuitive Verhalten kann dazu führen, dass Nutzer ungewollt Geheimnisse preisgeben.


      •  /