Abo
  • Services:
Anzeige
Dank einer neuen Technik wird die LTO in LLVM deutlich schneller.
Dank einer neuen Technik wird die LTO in LLVM deutlich schneller. (Bild: LLVM)

Link-Time-Optimization: LLVM macht LTO fast so schnell wie normale Optimierung

Dank einer neuen Technik wird die LTO in LLVM deutlich schneller.
Dank einer neuen Technik wird die LTO in LLVM deutlich schneller. (Bild: LLVM)

Mit einer neuen Art der Optimierung während des Linkens eines Programms (LTO) benötigt LLVM nur etwas mehr Zeit als bei der "normalen" Optimierung beim Kompilieren. Auch den Speicherbedarf für LTO konnte das Team drastisch reduzieren.

Die meisten Compiler verfügen inzwischen über Möglichkeiten der Programmoptimierung, etwa um die Laufzeit zu verbessern. Bei der Link-Time-Optimization (LTO) wird dieser Vorgang erst beim Linken des Programms durchgeführt, wodurch das gesamte Programm auch über mehrere Module hinweg optimiert werden kann. Mit dem neuen Ansatz Thin LTO hat es das LLVM-Team geschafft, den für den Vorgang benötigten Speicherbedarf drastisch zu reduzieren und nur noch etwas mehr Zeit als für die normale Optimierung zu benötigen.

Anzeige
  • Der Ablauf des neuen Thin LTO (Bild: LLVM)
  • Der Ablauf des alten LTO (Bild: LLVM)
Der Ablauf des neuen Thin LTO (Bild: LLVM)

Trotz der durch LTO meist besseren Ergebnisse im Vergleich zur normalen Optimierung hatte die Technik vor allem für sehr große Anwendungen entscheidende Nachteile. Denn bei dem bisherigen Ansatz ist der gesamte erzeugte Bitcode zu einem großen monolithischen Modul zusammengefasst worden, auf dem dann die Optimierungen in einem einzigen Thread durchgeführt worden sind.

Paralleler Ablauf dank Zusatzinformationen

Bei Thin LTO wird jedoch auf das Zusammenführen des Bitcodes zu dem monolithischen Modul vollständig verzichtet. Um dennoch eine globale Analyse des gesamten Programms durchführen zu können, werden kompakte Übersichten der einzelnen kleineren Module erstellt. Ebenso wird ein Index der Orte von Funktionen erstellt, um diese später über Modulgrenzen hinweg importieren zu können. Dieser Import umfasst zudem nur jene Funktionen, die wahrscheinlich von einer Inline-Ersetzung betroffen sein werden. Die tatsächlichen Optimierungen geschehen dann völlig parallel in mehreren Threads.

Die wichtigste Voraussetzung für diesen Ablauf sei das Erstellen der Übersichten der Module, die quasi nebenbei beim Kompilieren in die LLVM-Zwischenschicht (Intermediate Representation, IR) erzeugt werden. Dabei werden sämtliche globalen Variablen und Funktionen berücksichtigt und eine Modul-Übersicht enthält zudem Metadaten, die als Abstraktion für einzelne Symbole dienen soll.

Zwar sei Thin LTO noch in Arbeit, die LLVM-Autoren bewerten dessen Leistung aber im Vergleich zur bisherigen LTO als gut. So werden in vielen Fällen die Leistungssteigerungen des LTO auch mit der neuen Technik erreicht. Allerdings ist der gesamte Kompiliervorgang mit dem neuen Ansatz wesentlich schneller als das alte LTO und reicht fast an die Geschwindigkeit des Kompilierens mit der normalen Optimierung heran. Darüber hinaus sind anders als bei der alten Technik mit Thin LTO sehr schnelle inkrementelle Builds möglich.

Derzeit genutzt werden kann Thin LTO mit dem Gold Plugin ebenso wie Ld64 in Apples Xcode 8. In der kommenden Version LLVM 3.9 wird das C-Frontend Clang Thin LTO über eine Kommandozeilenoption unterstützen.


eye home zur Startseite
das sushi 28. Jun 2016

Er ist noch nicht fertig, aber geben tut es ihn seit 3.7 glaub ich. Da ich keinen System...



Anzeige

Stellenmarkt
  1. Melitta Professional Coffee Solutions GmbH & Co. KG, Minden-Dützen
  2. ASTERION Germany GmbH, Viernheim/Rüsselsheim
  3. Robert Bosch GmbH, Weilimdorf
  4. über Duerenhoff GmbH, Berlin


Anzeige
Top-Angebote
  1. (u. a. HTC U Ultra für 399€ und Motorola Moto C Plus für 89€)
  2. 42,99€
  3. (heute u. a. Gran Turismo + Controller für 79€, ASUS ZenFone 4 Max für 199€ und Razer...

Folgen Sie uns
       


  1. Staingate

    Austauschprogramm für fleckige Macbooks wird verlängert

  2. Digitale Infrastruktur

    Ralph Dommermuth kritisiert deutsche Netzpolitik

  3. Elektroauto

    VW will weitere Milliarden in Elektromobilität investieren

  4. Elektroauto

    Walmart will den Tesla-Truck

  5. Die Woche im Video

    Ausgefuchst, abgezockt und abgefahren

  6. Siri-Lautsprecher

    Apple versemmelt den Homepod-Start

  7. Open Routing

    Facebook gibt interne Plattform für Backbone-Routing frei

  8. Übernahme

    Vivendi lässt Ubisoft ein halbes Jahr in Ruhe

  9. Boston Dynamics

    Humanoider Roboter Atlas macht Salto rückwärts

  10. Projekthoster

    Github zeigt Sicherheitswarnungen für Projektabhängigkeiten



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Universal Paperclips: Mit ein paar Sexdezillionen Büroklammern die Welt erobern
Universal Paperclips
Mit ein paar Sexdezillionen Büroklammern die Welt erobern
  1. Disney Marvel Heroes wird geschlossen
  2. Starcraft 2 Blizzard lästert über Pay-to-Win in Star Wars Battlefront 2
  3. Free to Play World of Tanks bringt pro Nutzer und Monat 3,30 Dollar ein

Star Wars Battlefront 2 im Test: Filmreife Sternenkrieger
Star Wars Battlefront 2 im Test
Filmreife Sternenkrieger
  1. Star Wars EA entfernt Mikrotransaktionen aus Battlefront 2
  2. Electronic Arts Community empört über freischaltbare Helden in Battlefront 2
  3. Star Wars Mächtiger Zusatzinhalt für Battlefront 2 angekündigt

Coffee Lake vs. Ryzen: Was CPU-Multitasking mit Spielen macht
Coffee Lake vs. Ryzen
Was CPU-Multitasking mit Spielen macht
  1. Custom Foundry Intel will 10-nm-Smartphone-SoCs ab 2018 produzieren
  2. ARM-Prozessoren Macom verkauft Applied Micro
  3. Apple A11 Bionic KI-Hardware ist so groß wie mehrere CPU-Kerne

  1. Re: Auf MacOS unbrauchbar

    Danse Macabre | 05:59

  2. Re: die alte leier

    teenriot* | 05:57

  3. Die Gesellschaft hat Schuld

    Schnippelschnappel | 05:11

  4. Re: Der Akku wird zu schnell geladen

    gehtjanx | 04:54

  5. warum wischt ihr nicht einfach alles weg?

    gehtjanx | 04:50


  1. 17:14

  2. 13:36

  3. 12:22

  4. 10:48

  5. 09:02

  6. 19:05

  7. 17:08

  8. 16:30


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel