Google Research: Warum kompiliert das nicht?
Ein Forscherteam hat bei Google mehr als 26 Millionen Software-Builds untersucht. Die gefundenen Fehlerarten sind dabei wenig überraschend. Dass die Fehlerrate nicht mit der Erfahrung der Entwickler korreliert, dagegen schon.

Quellcode schreiben - in Maschinensprache übersetzten - Programm ausführen. Diese optimale Abfolge der Softwareentwicklung wird häufig durch Fehler während des Kompilierens unterbrochen. In Zusammenarbeit mit Forschern der Hong Kong University of Science and Technology und der University of Nebraska hat ein Team von Google die Fehler in über 26 Millionen Softwarebuilds analysiert und kommt dabei zu teils überraschenden Ergebnissen.
So nahmen die Autoren etwa an, dass häufige Builds auch zu mehr Fehlern führten. Diese Hypothese ließ sich aber nicht bestätigen, da keine Korrelation zwischen der Anzahl an Builds und der Fehlerrate eines Entwicklers gefunden werden konnte. Ebenso hat die Erfahrung im Umgang mit den Builds keinen Einfluss auf die Fehlerrate. So ist es egal, ob der Entwickler im Vorzeitraum mehr als 1000 Builds auslöste oder weniger als 200. Das widerspricht klar der Annahme, dass erfahrene Entwickler weniger Fehler verursachten als Unerfahrene.
Fehlerarten sind erwartbar
Als Fehlermeldungen wertete das Team diejenigen aus, die von den Compilern Javac für Java und LLVMs Clang für C++-Code ausgegeben werden. Die mit Abstand meisten Fehler entfallen demnach auf nicht richtig aufgelöste Abhängigkeiten zwischen verschiedenen Klassen und Quelltextdateien. Bei C++ betrifft dies etwa die Hälfte aller aufgetretenen Probleme, bei Java sogar knapp zwei Drittel.
Die zweithäufigste Ursache für Fehler sind nicht übereinstimmende Datentypen. Syntaxfehler in C++-Projekten sind ungefähr doppelt so häufig wie in Java-Code. Der Medianwert für die Fehlerrate aller Builds liegt für C++ bei etwa 38 Prozent, für Java bei etwa 29 Prozent.
Viele allgemeine Annahmen, etwa dass die C++-Syntax schwieriger sei als die von Java, werden durch diese Ergebnisse zumindest für Google bestätigt. Darüber hinaus sind Syntax- und Semantik-Fehler aber eher selten, und das Schwierige an der Entwicklung ist die eigentliche Code-Organisation der Projekte. Die Unterstützung für Letzteres sollte auch vermehrt in die entsprechenden Werkzeuge eingebaut werden, schlussfolgern die Autoren.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Was wird unterbunden? Ein Byte-Array zu allozieren und dann zu benutzen, wie ich gerne...
Eben nicht. Wie du am Beispiel siehst betrifft die Änderung alle persistierbaren...
Das kommt darauf an was man machen will. Klar manches aus dem Buch würde man heute...
Genau deswegen wundere ich mich doch so und habe nachgefragt.