Neuronale Netze: Weniger Bugs und mehr Spielspaß per Deep Learning
Besser ausbalancierte Schwierigkeitsgrade und mehr Spaß: Spielentwickler könnten mit neuronalen Netzen ihre Produkte optimieren, sagt der Data Scientist Matthias Platho. Allerdings dürfte das nicht allen Spielern gefallen.

Wann braucht ein Computerspieler eine Belohnung in einem Online-Rollenspiel? Es gibt Entwicklerstudios, in denen sich riesige Teams mit dieser Frage beschäftigen. Manche gehen nach ihrem Bauchgefühl vor, andere verwenden sogenannte A-B-Tests: Ein Teil der Spieler bekommt ein besonderes Schwert nach fünf Minuten, ein anderer Teil erst nach 30 Minuten. Die Gruppe, die anschließend länger dabeibleibt, gilt als zufriedener - und alle Spieler bekommen das Schwert dann nach der optimierten Zeitdauer.
"A-B-Tests funktionieren, aber sie haben ein paar Probleme", sagt der Data Scientist Matthias Platho auf der Spielemesse Quo Vadis 16 in Berlin. "Ein paar der unzufriedenen Spieler können verloren gehen, und bei komplexeren Fragestellungen wird es kompliziert". Sobald es etwa um das Überprüfen von acht Optionen gehe - Schwert plus Schild plus Diamant und mehr -, müssten die Entwickler 256 Gruppen bilden und ihre Daten auswerten. In der Praxis ist das schon nicht mehr sinnvoll durchführbar.
Platho schlägt einen anderen Ansatz vor: Per Deep Learning könnte dieses Problem schneller und zuverlässiger gelöst werden. Diese Art des Maschinenlernens basiert auf neuronalen Netzen mit mehreren Schichten. "Die Algorithmen haben im Idealfall möglichst umfangreiche Informationen über den Spieler: sein Alter, das Geschlecht, seine Aktionen im Spiel sowie den Level und die bisherigen Belohnungen." Mit den neuronalen Netzen lasse sich dann erstaunlich präzise voraussagen, wann er im Idealfall eine Belohnung bekommen muss - etwa das Schwert.
Das System braucht klare Ziele
Laut Platho müssen die Entwickler ihrem neuronalen Netz präzise sagen, in welchem Sinne es optimieren soll. Dabei könne es ums schlichte Weiterspielen gehen, aber auch ums Geldausgeben. Die Algorithmen wüssten dann also mit einer recht hohen Trefferquote, wann der Spieler ein Schwert angeboten bekommen sollte oder wann er besonders empfänglich für einen kleinen Rabatt wäre - nicht jedem dürfte es gefallen, derart gezielt zum Geldausgeben verführt zu werden.
Derlei Deep-Learning-Systeme könnten bereits heute gut funktionieren, sagt Platho. Sie benötigen nicht einmal besonders aufwendige Hardware: Ein einfacher PC mit einer GDX 970 reiche für den Anfang. Die Software, meist von Wissenschaftlern an Universitäten entwickelt, liegt als Open Source vor; gemeint sind Programme wie Torch, Tensor Flow, Caffeine oder Pylearn 2.
Deep Learning lässt sich in Spielen aber auch für andere Zwecke verwenden als nur die Optimierung. In vielen Games könnte damit das Balancing verbessert werden. Platho nennt als besonders gut geeignetes Beispielprogramm das Prügelspiel Street Fighter 5: "Die Algorithmen werden mit sehr ungewöhnlichen Aktionen anfangen und dann nach und nach grundlegende Probleme deutlich machen". Wenn die KI etwa nur noch Highkicks verwendet, bedeutet das ziemlich sicher, dass dieser Tritt übertrieben effektiv ist.
Das neuronale Netz als Spieler
Neuronale Netze sind nach Angaben von Platho mittlerweile recht gut darin, Spiele zu spielen. Dazu benötigen sie lediglich Zugriff auf den "Gamestate", etwa über eine API - aber im Grunde würde in vielen Fällen das Bild reichen, das auch ein Spieler auf dem Monitor sieht.
Beschränkungen gebe es lediglich in Spielen mit viel Handlungsfreiheit: In einem GTA, Tomb Raider oder Assassin's Creed seien neuronale Netze überfordert, sehr viel mehr als die ersten paar Minuten könnten sie in der Praxis beim aktuellen Stand der Technik selbst mit großem Aufwand kaum bewältigen.
Die Systeme könnten aber inzwischen noch mehr: Zum einen könnten Entwickler sie für die Suche nach echten Bugs einsetzen, mit denen sich Spieler etwa besonders viele Erfahrungspunkte oder andere Extras verschaffen. Sie könnten in Verbindung mit Systemen zur Textanalyse aber auch die Foren und sozialen Medien auswerten, so Platho. Dann könnten Entwickler an alle Kunden, die sich etwa über ein unfaires Kampfsystem beschwert haben, automatisch eine persönlich wirkende Mail mit einer Einladung für eine neue Runde mit einem Patch schicken.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
100 Punkte dafür.