OpenAI: GPT 5.2 meistert Wissenschaftsaufgaben mit neuer Präzision

OpenAI hat GPT 5.2 vorgestellt. Das neue Sprachmodell kann einiges mehr als sein Vorgänger, vor allem in Mathematik und den Naturwissenschaften(öffnet im neuen Fenster) . Mit GPT 5.2 könnten Forscher ihre Ideen schneller durchspielen, erklärte das Unternehmen. Menschliche Expertise ist aber nach wie vor erforderlich.
Hinter der Entwicklung steckt ein Jahr intensive Zusammenarbeit mit Forschern(öffnet im neuen Fenster) aus verschiedenen Bereichen – von Mathematik über Physik bis zu Biologie und Informatik. Im vergangenen Monat veröffentlichte OpenAI erste Fallstudien, die zeigten, wie GPT-5 Teams bei ihrer Arbeit in Astronomie oder Materialwissenschaft unterstützen könne. Mit GPT-5.2 sollen die Ergebnisse noch verlässlicher werden.
Die Zahlen aus den Benchmark-Tests klingen beeindruckend: GPT-5.2 Pro erreichte beim GPQA Diamond – einer anspruchsvollen Hochschulprüfung für Physik, Chemie und Biologie – eine Genauigkeit von 93,2 Prozent. Die Thinking-Variante kam auf 92,4 Prozent. Zum Vergleich: Der Vorgänger GPT-5.1 Thinking lag bei 88,1 Prozent.
Mathematische Denkfähigkeiten
Noch deutlicher wird der Fortschritt bei Frontiermath, wo mathematische Probleme in drei Schwierigkeitsstufen getestet werden. Dort löste GPT-5.2 Thinking 40,3 Prozent der Aufgaben – mit Zugang zu Python-Tools und maximaler Rechenkapazität. Das frühere Modell schaffte unter ähnlichen Bedingungen nur 31 Prozent.
OpenAI betonte, es gehe nicht um stupides Training für bestimmte Tests. Die Verbesserungen zeigten, dass das Modell grundlegend besser denken könne.
Die Modelle seien aber keine selbstständigen Forscher. Sie machten Fehler, verließen sich manchmal auf unausgesprochene Annahmen und brauchten Kontrolle. Fachwissen, Überprüfung und menschliches Urteilsvermögen blieben unverzichtbar für jeden Forschungsprozess, der solche Tools nutze.



