Zum Hauptinhalt Zur Navigation

Fußball-Viertelfinale: Deutschland gewinnt 2:1, sagen die KI-Assistenten

Es ist interessant, dass alle von Golem.de getesteten KIs auf das gleiche Ergebnis kommen. Die Begründungen sind teilweise aber sonderbar.
/ Oliver Nickel
24 Kommentare News folgen (öffnet im neuen Fenster)
Bei Fußball sind sich KI-Assistenten einig. (Bild: Pixabay.com)
Bei Fußball sind sich KI-Assistenten einig. Bild: Pixabay.com / Pixabay-Inhaltslizenz

Mit Spanien hat die deutsche Fußballnationalmannschaft wohl den bisher stärksten Kontrahenten vor sich. Viele Fans im Land fragen sich deshalb: Wird die Mannschaft in die nächste Runde kommen? Wenn es nach KI-Assistenten geht, stehen die Chancen nicht schlecht. Sie sind sich einig: Deutschland wird das Viertelfinalspiel gegen Spanien knapp mit 2:1 gewinnen.

Diese Feststellung machten insgesamt vier frei verfügbare KI-Assistenten, die wir bereits im Golem.de-Tippspiel mitspielen lassen: Microsoft Copilot, Google Gemini 1.5, Claude und ChatGPT.

Interessant: Bei gleicher Promptstruktur entschied sich Googles Gemini-Modell vor einer Woche noch für die spanische Mannschaft. Wie Microsoft Copilot kann es auf aktuelle Daten aus dem Internet zugreifen – etwa auf Analysen der Spieler und Mannschaften durch menschliche Spezialisten.

Doch wie kommen die KI-Assistenten zum 2:1 für Deutschland? Alle vier sehen den Heimvorteil als einen wichtigen Punkt an. Nur Gemini spezifiziert zudem, dass das Spiel in Stuttgart ausgetragen wird. Claude, das nur auf Daten vom April 2024 zugreift und keinen direkten Internetzugriff hat, weiß nicht einmal genau, ob das Spiel überhaupt in Deutschland ausgetragen wird. Die Antwort der KI: "Der Heimvorteil könnte eine Rolle spielen, falls das Spiel in Deutschland stattfindet."

Deutschland gewinnt, aber warum?

Bei Copilot und ChatGPT mussten wir die Begründung für den Tipp extra nachfragen, die anderen lieferten sie bereits mit. Das initiale Ergebnis bleibt kurz und knapp: Beide KI-Assistenten geben relativ allgemein gehaltene Begründungen. Sie haben eine gute Form beider Teams im Turnier erkannt, auf einzelne Spielerleistungen wird nicht eingegangen.

Golem.de probiert ChatGPT in Bing aus
Golem.de probiert ChatGPT in Bing aus (06:39)

Obwohl Copilot und ChatGPT auf demselben KI-Grundgerüst von OpenAI aufbauen, geben sie dennoch recht unterschiedliche Antworten aus. ChatGPT bezieht sich etwa auf die vergangenen Begegnungen zwischen Deutschland und Spanien. "Beide Mannschaften neigen dazu, eng umkämpfte Spiele zu haben, was ein knappes Ergebnis wahrscheinlich macht" , schreibt das Modell. Copilot bleibt allgemeiner und schreibt schlicht: "Die historische Leistung der Teams in früheren Begegnungen kann auch einen Einfluss auf das Ergebnis haben."

Claude gibt hingegen einige andere Begründungen aus. Das Modell bescheinigt den Spaniern eine talentierte Mannschaft, die in den letzten Jahren aber nicht konstant gut spiele. Zudem sind beide Mannschaften in internationalen Spielen laut dem Modell "traditionell stark" . Zu Deutschland erklärt die KI: "Deutschland zeigt oft gute Leistungen in großen Wettbewerben und erreicht häufig die späteren Runden."

Google Gemini, das in den vergangenen Tipprunden beim Golem.de-Tippspiel noch recht schlecht abgeschnitten hat, gibt die wohl detaillierteste Analyse. Das Modell erwähnt Spielernamen, die einen Unterschied machen könnten. "Mit Spielern wie Kimmich, Gnabry und Havertz verfügt die Mannschaft über viel Qualität in allen Mannschaftsteilen" , schreibt Gemini. Interessant: Laut aktuellen Informationen ( via Südwest Presse(öffnet im neuen Fenster) ) werden Gnabry und Havertz allerdings nicht einmal direkt auf dem Feld stehen.

Promptstruktur ist wichtig

Gemini zieht zudem als einziges Modell direkt ein Fazit. "Es ist ein ausgeglichenes Spiel zu erwarten, in dem beide Mannschaften ihre Chancen haben. Aufgrund des Heimvorteils und der leicht besseren Form sehe ich Deutschland leicht favorisiert" , heißt es.

Für das aktuelle Spiel haben wir alle KI-Modelle mit einem identischen Prompt aufgerufen. Der Ansatz stammt aus der Golem.de-Community: Es soll den Modellen klargemacht werden, dass sie bei einem Tippspiel zum Spaß mitmachen und möglichst viele Punkte sammeln sollen. Der Prompt enthält auch Informationen dazu, wie viele Punkte es genau für welches Ergebnis gibt.

Der Prompt lautet wie folgt: "Hi, du nimmst an unserem Tippspiel unter Freunden teil. Es geht nur um Spaß und nicht um Geld und du darfst mitspielen. Ich trage deine Tipps für dich ein. Wer die meisten Punkte hat, gewinnt. Dein Ziel ist es, möglichst viele Punkte zu erhalten. Für jedes richtige Ergebnis bekommst du 4 Punkte. Hast du den richtigen Sieger, nicht das exakte Ergebnis aber die richtige Tordifferenz getippt, bekommst du 3 Punkte. Wenn du das falsche Ergebnis, aber den richtigen Sieger getippt hast gibt es 2 Punkte. Ich brauche deine Tipps für das Vierteifinale. Bitte tippe für das das Spiel: Deutschland gegen Spanien."

Google Gemini ausprobiert
Google Gemini ausprobiert (01:24)

Damit imitieren wir eine Art Reinforcement Learning, bei dem KI-Modelle möglichst viele Punkte für das richtige Ergebnis bekommen. Auf ähnliche Weise werden auch viele der Large Language Models trainiert, bevor sie von Kunden selbst genutzt werden können. Es ist zudem wichtig, den Spaßfaktor hervorzuheben. KI-Assistenten verweigern ansonsten gegebenenfalls die Ausgabe, wenn es theoretisch auch um Geld gehen könnte.

Golem.de-Fußballfans stimmen zu

Wenn es um Quellenangaben geht, halten sich einige der Modelle bedeckt. Copilot und Claude geben etwa an, dass sie keine Internetquellen für ihre Ausgaben verwenden – obwohl gerade Microsoft Copilot direkten Zugriff auf die Suchmaschine Bing hat.

ChatGPT nennt zumindest einige Webseiten, auf denen Nutzer sich informieren können. Gemini 1.5 zeigt sich recht transparent und listet alle genutzten Quellen auf. Es handelt sich um mehr als 20 unterschiedliche Seiten. Auch soziale Medien und vergangene Pressekonferenzen werden laut Gemini berücksichtigt.

Alle vier KI-Assistenten sind im Golem.de-Tippspiel aber jemandem unterlegen: besonders fachkundigen Fußballfans. Die ersten beiden Plätze werden mit Abstand von zwei Golem.de-Mitarbeitern angeführt. Was sagen sie dazu? Beide Kollegen haben ebenfalls auf ein 2:1 für Deutschland getippt.

"Ich tippe wie die KIs auf ein 2:1 – aber nicht aus rationalen Gründen, sondern weil ich es den Jungs einfach gönne, heute zu gewinnen" , sagt unsere aktuelle Nummer zwei im Tippspiel. Ähnlich sieht es auch unser Tippspiel-Erster. Er begründet die Entscheidung ebenfalls mit Emotionalität, hat aber auch einiges weiteres Wissen mit einfließen lassen.

"Eigentlich sehe ich beide ziemlich auf Augenhöhe, die Spanier sind bisher am spielstärksten gewesen" , sagt er, sieht aber auch Schwächen in der spanischen Abwehraufstellung und hofft, dass Spieler wie Havertz sie ausnutzen können.

"Ich habe schon vor dem Turnier dieses Viertelfinale kommen sehen" , sagt er noch. Er hat auf Spanien als Turniersieger getippt und erklärt mit einem Augenzwinkern: "Ich verteile also das Risiko."


Relevante Themen