Abo
  • Services:
Anzeige

GCC 4.0 macht Programme und deren Entwicklung schneller

GCC nun mit automatischer Vektorisierung für SSE, SSE2 und Altivec

Ein Jahr nach der Veröffentlichung der Version 3.4 gab das GCC-Team nun die Version 4.0 frei. Neben der verbesserten internen Darstellungsform (Tree-SSA) kann die neue Version automatisch Schleifen für SSE und SSE2 der x86- und AMD64-Plattform sowie für Altivec auf PowerPC generieren.

Die jetzt freigegebene Version war ursprünglich als 3.5 geplant, wurde jedoch auf Grund der vielen internen Änderungen und Verbesserungen nach 4.0 umbenannt. Die größte Änderung ist die Verwendung von "Static Single Assignment Trees" für die interne Repräsentation des Codes. Dadurch ließen sich viele Optimierungen verbessern und neue implementieren. Unter den neuen Optimierungen ist auch die automatische Vektorisierung von Schleifen, für die Verwendung von SSE, SSE2 oder Altivec. Einen solchen Automatismus, für bisher eher von Hand zu erzeugende Optimierungen, boten zurzeit ausschließlich kommerzielle Compiler aus dem Hause Intel oder IBM.

Anzeige

Die Tree-SSA-Darstellung hilft jedoch auch in anderen Bereichen, wie dem Zusammenfassen von Gemeinsamkeiten, dem Eliminieren nicht verwendeter Ausdrücke sowie einigen normalen Optimierungsmethoden von Schleifen.

Auch das Starten von Programmen kann durch die neue GCC-Version beschleunigt werden: "-fvisibility-inlines-hidden" markiert in dem ELF-Bibliotheksformat alle "inline-bare"-Funktionen als nicht sichtbar und entfernt diese so aus der finalen Programmdatei. Bei modernem C++-Code werden so ca. 40 Prozent der Symbole entfernt und Programme bis zu 10 Prozent kleiner - und dadurch natürlich schneller geladen.

Im wissenschaftlichen Bereich lang erwartet, wurde der Ersatz des Fortan-77-Frontends, durch eine überarbeitete Version, die auch Fortan 90 und 95 akzeptiert. Der neue "gfortran" ist derzeit jedoch nicht mehr vollständig Fortan-77-konform, die Entwickler wollen in einer späteren Version aber wieder dafür sorgen.

Das Debuggen von optimiertem Code, in dem Code-Fragmente oft stark von der Reihenfolge in der Quelldatei abweichen, können "location lists" verbessern. Durch diese kann der GNU Debugger auch stark optimierten Code wieder das original Listing zuordnen.

Ebenfalls für Entwickler interessant ist, dass bei Abschalten jeglicher Optimierung mit '-O0' das C++-Frontend jetzt schneller ist als in jeder anderen GCC-Version zuvor. Dies kann den Editier-Compile-Zyklus in der Entwicklungsphase stark verkürzen.

Da, wie in jeder neuen GCC-Version, auch wieder ein paar historische, GCC-eigene Spracherweiterungen entfernt wurden, ist davon auszugehen, dass in dem einen oder anderen historisch gewachsenen Code kleine Änderungen vorzunehmen sind, bis er sich wieder mit dem aktuellen GCC übersetzen lässt. Positiv ist, dass solche Änderungen auch die Kompatibilität mit anderen ANSI-konformen Compilern erhöhen.

Eine Übersicht aller Änderungen ist auf der Projekt-Homepage zu finden, hier steht GCC 4.0 auch zum Download bereit. [von René Rebe]


eye home zur Startseite
keine ahnung 12. Jun 2005

also wir haben hier 10 der neuesten mainframes stehen. und an diese i/o raten kommen...



Anzeige

Stellenmarkt
  1. über Duerenhoff GmbH, Raum Frankfurt am Main
  2. Bechtle Clouds GmbH, Frankfurt am Main
  3. Siemens Postal, Parcel & Airport Logistics GmbH, Nürnberg
  4. NORD-MICRO GmbH & Co. OHG, Frankfurt am Main


Anzeige
Blu-ray-Angebote
  1. 79,99€ (Vorbesteller-Preisgarantie)
  2. 299,99€ (Vorbesteller-Preisgarantie)
  3. 12,99€

Folgen Sie uns
       


  1. Staingate

    Austauschprogramm für fleckige Macbooks wird verlängert

  2. Digitale Infrastruktur

    Ralph Dommermuth kritisiert deutsche Netzpolitik

  3. Elektroauto

    VW will weitere Milliarden in Elektromobilität investieren

  4. Elektroauto

    Walmart will den Tesla-Truck

  5. Die Woche im Video

    Ausgefuchst, abgezockt und abgefahren

  6. Siri-Lautsprecher

    Apple versemmelt den Homepod-Start

  7. Open Routing

    Facebook gibt interne Plattform für Backbone-Routing frei

  8. Übernahme

    Vivendi lässt Ubisoft ein halbes Jahr in Ruhe

  9. Boston Dynamics

    Humanoider Roboter Atlas macht Salto rückwärts

  10. Projekthoster

    Github zeigt Sicherheitswarnungen für Projektabhängigkeiten



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Universal Paperclips: Mit ein paar Sexdezillionen Büroklammern die Welt erobern
Universal Paperclips
Mit ein paar Sexdezillionen Büroklammern die Welt erobern
  1. Disney Marvel Heroes wird geschlossen
  2. Starcraft 2 Blizzard lästert über Pay-to-Win in Star Wars Battlefront 2
  3. Free to Play World of Tanks bringt pro Nutzer und Monat 3,30 Dollar ein

Star Wars Battlefront 2 im Test: Filmreife Sternenkrieger
Star Wars Battlefront 2 im Test
Filmreife Sternenkrieger
  1. Star Wars EA entfernt Mikrotransaktionen aus Battlefront 2
  2. Electronic Arts Community empört über freischaltbare Helden in Battlefront 2
  3. Star Wars Mächtiger Zusatzinhalt für Battlefront 2 angekündigt

Coffee Lake vs. Ryzen: Was CPU-Multitasking mit Spielen macht
Coffee Lake vs. Ryzen
Was CPU-Multitasking mit Spielen macht
  1. Custom Foundry Intel will 10-nm-Smartphone-SoCs ab 2018 produzieren
  2. ARM-Prozessoren Macom verkauft Applied Micro
  3. Apple A11 Bionic KI-Hardware ist so groß wie mehrere CPU-Kerne

  1. Re: Von 74 Milliarden Investitionen insgesamt...

    Emulex | 08:00

  2. Um Gottes Willen...

    Emulex | 07:56

  3. Re: "Qualität" ... aus einer Blechdose

    jo-1 | 07:51

  4. Re: Elektro Trucks sind leiser und somit entsteht...

    Ach | 07:47

  5. Re: A8-Chip

    jo-1 | 07:44


  1. 17:14

  2. 13:36

  3. 12:22

  4. 10:48

  5. 09:02

  6. 19:05

  7. 17:08

  8. 16:30


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel