Die KI-Falle für Nachwuchs-Programmierer: Schneller coden, weniger verstehen

Inhalt
KI-Werkzeuge versprechen höhere Effizienz in der Softwareentwicklung. Einer dieser Anbieter ist Anthropic mit Claude Code. Der Hersteller hat nun untersucht(öffnet im neuen Fenster) , welchen Preis diese Produktivität haben könnte. In einem kontrollierten Experiment mit 52 Softwareentwicklern hat sich gezeigt: Wer beim Lernen neuer Programmierfähigkeiten auf KI setzt, schneidet bei Verständnistests deutlich schlechter ab. Man könnte auch sagen, durch die Delegation an KI wird der Entwickler nicht schlauer.
Die Teilnehmer sollten eine Python-Bibliothek namens Trio erlernen, die sie zuvor nicht kannten. Eine Gruppe durfte dabei einen KI-Assistenten nutzen, die andere musste den Code von Hand schreiben. Am Ende absolvierten alle einen Test über die verwendeten Konzepte.
Das Ergebnis: Die KI-Gruppe erreichte im Schnitt 50 Prozent der möglichen Punkte, während die Kontrollgruppe auf 67 Prozent kam. Das entspricht einem Unterschied von fast zwei Notenstufen. Besonders ausgeprägt war die Lücke bei Debugging-Aufgaben, also beim Aufspüren und Beheben von Fehlern.
Wie Menschen mit KI-Assistenten umgehen
Die Forscher analysierten die Bildschirmaufzeichnungen und identifizierten verschiedene Nutzungsmuster. Einige Entwickler delegierten die gesamte Codeerstellung an die KI und erreichten die schlechtesten Testergebnisse. Sie arbeiteten zwar am schnellsten, lernten aber am wenigsten.
Andere Teilnehmer begannen eigenständig, verließen sich aber zunehmend auf die KI. Wieder andere nutzten den Assistenten hauptsächlich zum Debuggen, ohne die Fehlerursachen wirklich zu verstehen. All diese Gruppen erzielten Durchschnittswerte unter 40 Prozent.
Erfolgreicher waren jene, die KI als Lernwerkzeug einsetzten. Sie ließen Code generieren, stellten dann aber Rückfragen, um das Vorgehen zu verstehen. Oder sie baten um Erklärungen zusammen mit dem Code. Eine Gruppe stellte nur konzeptuelle Fragen und schrieb den Code selbst – sie war nicht nur erfolgreich im Test, sondern auch relativ schnell.
Der Zeitgewinn durch KI fiel geringer aus als erwartet. Die KI-Gruppe beendete die Aufgaben im Durchschnitt etwa zwei Minuten früher, was statistisch nicht aussagekräftig war. Manche Teilnehmer verbrachten bis zu elf Minuten – 30 Prozent der verfügbaren Zeit – mit dem Formulieren von Anfragen an den Assistenten.