Grok, Gemini, Llama: KIs treten in Pokerturnier gegeneinander an

Wie schlagen sich KI-Modelle der meisten großen Hersteller in einem Spiel der Wahrscheinlichkeiten? Das soll ein kleines Projekt des KI-Experten Maxim Pavlov herausfinden. Er richtet über einige Tage ein digitales Pokerturnier(öffnet im neuen Fenster) aus, das diverse LLMs gegeneinander antreten lässt.
Mit dabei sind große Namen wie Grok 4, OpenAI o3, Claude Sonnet 4.5, Deepseek R1 und Gemini 2.5 Pro. Auch Mistral Magistral, Metas Llama 4, Kimi K2 und Z.AI GLM6 sind vertreten. Insgesamt neun LLMs werden für das Turnier eingesetzt.
Gespielt wird die weitverbreitete Pokervariante Texas Hold'em. Jedes LLM bekommt dabei pro Runde zwei Karten auf die Hand. Anschließend werden Wettrunden abgehalten und weitere offene Karten nach und nach aufgedeckt. Den Einsatz gewinnt die Hand, die als letzte in der Runde ist oder die ein höheres Blatt als alle anderen Hände vorzeigen kann – also etwa einen Flush, Drei Gleiche oder zwei Paare. Anschließend werden die Karten neu verteilt.
Pavlov lässt vier Tische gleichzeitig laufen. An jedem dieser Tische sitzen alle neun Kontrahenten. Neben den einzelnen Tischen werden vergangene Spielzüge aufgelistet. Das können wie bei echten Pokerspielern Calls, Folds oder Raises sein. Die LLMs notieren sich Beobachtungen zu Kontrahenten, diese können Interessenten und Zuschauer in einer Liste zu jedem der neun LLMs lesen.
LLMs als Pokerhilfe?
Aktuell scheint es, als ob das von xAI entwickelte Grok 4 das Turnier mit einem bisherigen Gewinn von mehr als 21.000 US-Dollar als Sieger verlässt. Auf Platz zwei und drei sind OpenAI o3 und Claude Sonnet 4.5. Das Ziel soll es generell sein, Denkprozesse und Mustererkennungen von LLMs zu testen. Poker ist im echten Leben zudem ein Spiel mit starker psychologischer und sozialer Komponente, die mit Wahrscheinlichkeitsrechnung und natürlich Kartenglück kombiniert wird.
"LLMs scheinen natürlich ein Werkzeug zu sein, das beim Pokerlernen helfen könnte – indem sie Hände aufschlüsseln, Entscheidungen erklären und im Wesentlichen alle verschiedenen Teile des Spiels in ein zusammenhängendes Ganzes integrieren" , schreibt Pavlov im Blogpost(öffnet im neuen Fenster) . "Doch innerhalb der Poker-Community herrscht noch immer kein Konsens darüber, wie zuverlässig die LLM-Argumentation wirklich ist." Das virtuelle Pokerturnier soll diese Aspekte untersuchen.



