Anzeige
Go-Brett: Europameister geschlagen
Go-Brett: Europameister geschlagen (Bild: Donarreiskoffer/Wikipedia/CC-BY 3.0)

Computer Go: Alpha Go besiegt europäischen Meister im Go

Go-Brett: Europameister geschlagen
Go-Brett: Europameister geschlagen (Bild: Donarreiskoffer/Wikipedia/CC-BY 3.0)

Jahre früher als erwartet hat ein Computer den amtierenden Europameister in Go besiegt. Geschafft wurde das mit Zufall und neuronalen Netzen.

Das Computer-Go-Programm Alpha Go hat es geschafft, Fan Hui in fünf Spielen ohne Handicap zu besiegen. Der in Frankreich lebende Chinese ist der derzeitige europäische Meister im Go. Bisher spielten Computerprogramme im Go ausschließlich auf Amateurniveau. Nur auf kleineren Brettern konnten sie gegen professionelle Go-Spieler gewinnen. Ein Spiel gegen Lee Sedol, einen der besten Go-Spieler der Welt, ist für März angesetzt. Dahinter stehen Anstrengungen von Google Deepmind in der Entwicklung von computerbasierten neuronalen Netzwerken.

Anzeige

Ein solches Ergebnis wurde erst in einigen Jahren erwartet, es stellt eine sprunghafte Verbesserung der Leistung solcher Programme dar. In ihrem Paper schreiben die Programmierer, dass ihr Programm in einem Test die bisher besten kommerziellen Computerprogramme in 494 von 495 Spielen besiegt hat. Diese Leistung wurde durch die Kombination von herkömmlichen Techniken und neuronalen Netzwerken möglich.

Entwicklungssprung in der Spielstärke

Diese Entwicklung stellt nach zehn Jahren einen zweiten Sprung in der Verbesserung von Computerprogrammen im Go dar. Bis 2006 basierten alle Computer-Go-Programme auf algorithmischen Strukturen, die mögliche Züge nacheinander auswerteten, unterstützt von Eröffnungsbibliotheken. Der Ansatz war ähnlich den Schachprogrammen, wie etwa Deep Blue, die in der Lage waren, die besten Schachspieler der Welt zu besiegen.

Dieser Ansatz scheiterte im Go. Programme wie GnuGo kamen über die niedrigen Kyu-Ränge der Amateure nicht hinaus. Das sind die "Schülerränge" im Go. Danach folgen die Amateur-"Dan"-Ränge, also Meisterränge. Professionelle Spieler haben ein eigenes Rangsystem, das hauptsächlich auf Titelgewinnen und der Anzahl gewonnener Spiele beruht, aber die Zahl verlorener Spiele außer Acht lässt.

Zufällige Spiele sorgten für Qualität durch Quantität

Die Amateur-Dan-Ränge kamen erst 2006 durch Einführung von Monte-Carlo-Algorithmen in Reichweite. Anstatt von detaillierter Auswertung der Brettstellung werden dabei große Zahlen von zufälligen Spielen generiert. Auf der Grundlage dieser zufälligen Spiele wird dann eine Rangordnung der nächsten möglichen Züge erstellt und der oberste Zug der Rangordnung gewählt. Je mehr zufällige Spiele im Anschluss an einen bestimmten Zug gewonnen werden, desto höher steht der Zug in der Rangordnung.

Wegen der geringen Rechenbelastung bei zufälligen Spielen kann so eine sehr große Zahl von Spielen in kurzer Zeit ausgewertet werden. Zu diesem Vorgehen kommen aber noch Eröffnungsbibliotheken und einzelne Algorithmen, um das Verhalten in bestimmten Spielsituationen zu verbessern, etwa die Erkennung von Treppen. Das ist eine einfache Formation von Steinen, die einem klaren Muster folgt, aber erst nach einer großen Zahl von Zügen zum Fangen der Steingruppe führt. Die Treppe gehört zu den ersten Fangtechniken, die ein Anfänger lernt. Solche Muster können in der Auswertung von zufälligen Spielen nicht zuverlässig erfasst werden.

Neuronale Netze ergänzen den Zufall

Für die Entwicklung von Alpha Go wurden neuronale Netzwerke erstellt und trainiert, wofür unter anderem die Datenbank der über 150.000 Spiele auf dem Kiseido Go Server (KGS) verwendet wurde. Während die so trainierten neuronalen Netzwerke tatsächlich die mittleren Dan-Ränge erreichten, stellten sie zunächst keine wesentliche Steigerung der Spielstärke gegenüber älteren Programmen dar.

Ein wesentlicher Grund dafür ist die hohe Rechenbelastung bei der Bewertung von Zugfolgen in neuronalen Netzwerken. Der Erfolg von Alpha Go beruht auf einer Kombination aller bisher entwickelten Techniken. Die Auswertung aus dem neuronalen Netzwerk ergibt dabei eine unabhängige Gewichtung der Züge aus den zufälligen Spielen der Monte-Carlo-Algorithmen. Der Ansatz wurde bereits im Jahr 2000 verfolgt, allerdings war das neuronale Netzwerk dort ein menschliches Gehirn, das zwischen den vorgeschlagenen Zügen von zwei Computerprogrammen den besseren Zug auswählt.

Erstaunlicherweise war aber auch das neuronale Netzwerk nach dem Training mit über 100.000 Spielen nicht in der Lage, eine Treppe zuverlässig zu erkennen und zu spielen. Den Grund vermuten die Programmierer in der Abwesenheit von ausgespielten Treppen in der Spieldatenbank. Solche Sequenzen sind nur in Ausnahmenfällen tatsächlich im Spiel zu beobachten, weil der Fang von Steinen in einer Treppe unvermeidlich und allen Spielern bekannt ist. Für solche und ähnliche Situationen werden deshalb feste Suchalgorithmen eingesetzt.

Im März ist ein Spiel gegen Lee Sedol angesetzt. Der südkoreanische Spieler gilt als einer der besten der Welt.


eye home zur Startseite
Nocta 29. Jan 2016

Dazu fällt mir nur ein Beispiel ein, was aber nichts mit KI zu tun hat: In Warcraft 3 gab...

Nocta 29. Jan 2016

Ich finde es immer wieder erstaunlich, mit welchen einfachen Methoden die KI heutzutage...

SchreibenderLeser 28. Jan 2016

...Es hatte es nie nötig, dadurch gelobt zu werden, dass es im Gegensatz zu Schach noch...

QCube 28. Jan 2016

für alle die fans von Neuronalen Netzen sind wie ich. Zudem bin ich ein Go-Fan. Das...



Anzeige

Stellenmarkt
  1. Deutsche Telekom AG, Düsseldorf
  2. Fraunhofer-Institut für Fertigungstechnik und Angewandte Materialforschung IFAM, Bremen
  3. Amedes Medizinische Dienstleistungen GmbH, Hamburg
  4. Detecon International GmbH, Köln, Frankfurt am Main


Anzeige
Hardware-Angebote

Folgen Sie uns
       


  1. Tolino Page

    Günstiger Kindle-Konkurrent hat eine bessere Ausstattung

  2. Nexus

    Erste Nougat-Smartphones sollen von HTC kommen

  3. Hafen

    Die Schauerleute von heute sind riesig und automatisch

  4. VATM

    Bundesnetzagentur bringt Preiserhöhung bei VDSL

  5. The Collection

    Bioshock-Spiele werden technisch überarbeitet

  6. Passwort-Cracker

    Hashcat will jetzt auch Veracrypt knacken können

  7. Sparc S7

    Oracle attackiert Intels Xeon mit acht Kernen bei 4,27 GHz

  8. Musikstreaming

    Spotify wirft Apple Behinderung des Wettbewerbs vor

  9. Fireflies

    Günstige Bluetooth-Ohrstecker sollen 100 US-Dollar kosten

  10. Twitch

    "Social Eating" als neuer Kanal



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Rust: Ist die neue Programmiersprache besser?
Rust
Ist die neue Programmiersprache besser?
  1. Fraunhofer SIT Volksverschlüsselung startet ohne Quellcode
  2. Microsoft Plattformübergreifendes .Net Core erscheint in Version 1.0
  3. Oracle-Anwältin nach Niederlage "Google hat die GPL getötet"

Mikko Hypponen: "Microsoft ist nicht mehr scheiße"
Mikko Hypponen
"Microsoft ist nicht mehr scheiße"

Zelda Breath of the Wild angespielt: Das Versprechen von 1986 wird eingelöst
Zelda Breath of the Wild angespielt
Das Versprechen von 1986 wird eingelöst

  1. Re: Normalerweise reicht es bei Apple schon...

    RedHunt | 13:32

  2. Buddeln vs. Miete

    barforbarfoo | 13:31

  3. Re: Liest ein Roboter oder ein Mensch?

    Itchy | 13:31

  4. Re: Na dann ...

    RipClaw | 13:30

  5. Re: Alternative

    Its_Me | 13:30


  1. 13:29

  2. 12:22

  3. 12:03

  4. 12:01

  5. 11:55

  6. 11:39

  7. 11:35

  8. 10:36


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel