GCC 4.0 macht Programme und deren Entwicklung schneller
GCC nun mit automatischer Vektorisierung für SSE, SSE2 und Altivec
Ein Jahr nach der Veröffentlichung der Version 3.4 gab das GCC-Team nun die Version 4.0 frei. Neben der verbesserten internen Darstellungsform (Tree-SSA) kann die neue Version automatisch Schleifen für SSE und SSE2 der x86- und AMD64-Plattform sowie für Altivec auf PowerPC generieren.
Die jetzt freigegebene Version war ursprünglich als 3.5 geplant, wurde jedoch auf Grund der vielen internen Änderungen und Verbesserungen nach 4.0 umbenannt. Die größte Änderung ist die Verwendung von "Static Single Assignment Trees" für die interne Repräsentation des Codes. Dadurch ließen sich viele Optimierungen verbessern und neue implementieren. Unter den neuen Optimierungen ist auch die automatische Vektorisierung von Schleifen, für die Verwendung von SSE, SSE2 oder Altivec. Einen solchen Automatismus, für bisher eher von Hand zu erzeugende Optimierungen, boten zurzeit ausschließlich kommerzielle Compiler aus dem Hause Intel oder IBM.
Die Tree-SSA-Darstellung hilft jedoch auch in anderen Bereichen, wie dem Zusammenfassen von Gemeinsamkeiten, dem Eliminieren nicht verwendeter Ausdrücke sowie einigen normalen Optimierungsmethoden von Schleifen.
Auch das Starten von Programmen kann durch die neue GCC-Version beschleunigt werden: "-fvisibility-inlines-hidden" markiert in dem ELF-Bibliotheksformat alle "inline-bare"-Funktionen als nicht sichtbar und entfernt diese so aus der finalen Programmdatei. Bei modernem C++-Code werden so ca. 40 Prozent der Symbole entfernt und Programme bis zu 10 Prozent kleiner - und dadurch natürlich schneller geladen.
Im wissenschaftlichen Bereich lang erwartet, wurde der Ersatz des Fortan-77-Frontends, durch eine überarbeitete Version, die auch Fortan 90 und 95 akzeptiert. Der neue "gfortran" ist derzeit jedoch nicht mehr vollständig Fortan-77-konform, die Entwickler wollen in einer späteren Version aber wieder dafür sorgen.
Das Debuggen von optimiertem Code, in dem Code-Fragmente oft stark von der Reihenfolge in der Quelldatei abweichen, können "location lists" verbessern. Durch diese kann der GNU Debugger auch stark optimierten Code wieder das original Listing zuordnen.
Ebenfalls für Entwickler interessant ist, dass bei Abschalten jeglicher Optimierung mit '-O0' das C++-Frontend jetzt schneller ist als in jeder anderen GCC-Version zuvor. Dies kann den Editier-Compile-Zyklus in der Entwicklungsphase stark verkürzen.
Da, wie in jeder neuen GCC-Version, auch wieder ein paar historische, GCC-eigene Spracherweiterungen entfernt wurden, ist davon auszugehen, dass in dem einen oder anderen historisch gewachsenen Code kleine Änderungen vorzunehmen sind, bis er sich wieder mit dem aktuellen GCC übersetzen lässt. Positiv ist, dass solche Änderungen auch die Kompatibilität mit anderen ANSI-konformen Compilern erhöhen.
Eine Übersicht aller Änderungen ist auf der Projekt-Homepage zu finden, hier steht GCC 4.0 auch zum Download bereit. [von René Rebe]
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed









also wir haben hier 10 der neuesten mainframes stehen. und an diese i/o raten kommen...