KI: Google wird mit zwei P geschrieben
Aktuell machen Screenshots eines kuriosen Rechtschreibfehlers des KI-Modus der Google-Suche die Runde(öffnet im neuen Fenster). Dabei wird Google gefragt, wie viele P im Wort Google enthalten sind. Gemini antwortet, dass Google mit zwei P geschrieben wird; manchmal lautet die Antwort auch ein P. Darin schließt sich oft eine Erklärung an, wofür das P steht.
Das Problem tritt in verschiedenen Sprachen auf – auch auf Deutsch. Als wir nach der Anzahl der P in Google fragten, lieferte die KI-Übersicht uns ebenfalls eine skurrile Antwort, in der gleich zwei verschiedene Resultate steckten: ein großes P für den Mitgründer Larry Page oder zwei kleine P.
Das Problem, dass KI-Modelle schlecht buchstabieren können, ist nicht neu. Ein Klassiker ist, eine KI danach zu fragen, wie viele R im englischen Wort für Erdbeere, strawberry, vorkommen. Daran scheitern LLMs bereits seit Jahren immer wieder.
LLMs sehen Token, keine Buchstaben
Einer der Gründe ist, dass LLMs Worte nicht wie Menschen als Anordnung bestimmter Buchstaben begreifen, sondern als verschiedene Token. Ein Wort wird von KIs häufig in unterschiedliche Bedeutungseinheiten unterteilt – in Wortbestandteile, Silben oder Buchstaben.
Das Wort Katzenfutter etwa besteht daher für manche LLMs nicht aus den einzelnen Buchstaben, sondern eher aus den Teilen Katze und Futter. KI-Modelle versehen die Token mit Nummern und verwenden diese, um eine Kontextantwort zu finden – auch, wenn sie die Wörter in Buchstaben unterteilen. Welche Buchstaben innerhalb dieser Token stecken, ist den LLMs dabei in der Regel nicht bekannt.
Häufig verwendete Wörter können LLMs mittlerweile aber besser buchstabieren als früher. Aufgrund der grundlegenden Funktionsweise sind die Modelle aber wesentlich besser in kontextualisierten Antworten oder auch beim Programmieren.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



