GPT-4, Llama, Claude und Palm: Können Sprachmodelle denken?

Große Sprachmodelle wie GPT-4, Llama, Claude und Palm haben sich in den vergangen Jahren immens verbessert. Dabei hat sich die Methode, auf der diese Fortschritte basieren, nämlich die Transformer Netzwerke, nicht grundlegend verändert. Stattdessen wurde im Wesentlichen skaliert: mehr Parameter, mehr Daten, mehr Rechnerleistung. Doch diese rein quantitativen Veränderungen bringen unvorhergesehene, qualitativ neue Phänomene zutage.
Der Umstand, dass aus quantitativen Veränderungen qualitativ neue Phänomene entstehen können, nennt sich Emergenz. Ein paar Beispiele: Aus DNA-Molekülen entspringt Leben, aus Neuronen entwickelt sich Bewusstsein, aus Tönen entsteht Sprache, aus Pixeln entsteht ein Bild. Auf konzeptueller Ebene prominent beschrieben wurde dieses Phänomen 1972 in der Zeitschrift Science von dem Physiker Philip Anderson unter dem bezeichnenden Titel More is Different(öffnet im neuen Fenster) .