Entwicklerleitfaden

Load/Execute soll AMDs Bulldozer schneller machen

AMD hat den Leitfaden zur Programmierung der kommenden Prozessoren mit Bulldozer-Architektur veröffentlicht. Darin enthalten ist auch eine bewertete Liste der Neuerungen, die am meisten Tempo bringen sollen.

Artikel veröffentlicht am ,
Das 'shared frontend'
Das 'shared frontend'

Galt bisher AMDs "shared frontend" als architektonisch spannendste Neuerung von AMDs Bulldozer, so sieht das der Chiphersteller selbst etwas anders. Das Unternehmen hat nun den "Software Optimization Guide" für die Bulldozer-Familie (15h laut CPUID-Befehl) als PDF veröffentlicht.

  • Das shared frontend im Detail
  • AMDs Top 12 der Bulldozer-Neuerungen für Programmierer
AMDs Top 12 der Bulldozer-Neuerungen für Programmierer
Stellenmarkt
  1. Chapter Lead & Software Tester (m/w/d*)
    ista Deutschland GmbH, Essen
  2. Business Intelligence Analyst (m/w/d)
    Hays AG, Sachsen-Anhalt
Detailsuche

Darin enthalten ist auch eine Liste der neuen Funktionen, die nach Wirksamkeit für Programmierer sortiert ist. An erster Stelle führt AMD sogenannte "Load-Execute Instructions" auf. Dabei können sowohl Integer- als auch FP-Befehle direkt nach dem Laden aus dem L1-Cache ausgeführt werden - ohne Umweg über den Scheduler. Das soll offenbar dafür sorgen, dass die gegenüber dem Frontend doppelt ausgeführten Scheduler nicht ins Leere laufen, denn nicht unter allen Bedingungen ist eine Umgehung des Schedulers sinnvoll.

So gibt es durchaus selten benutzte Befehle, die so viele Takte beanspruchen, dass eine Neusortierung durch den Scheduler sinnvoll ist. Viele Basisoperationen wie das Addieren oder Subtrahieren besitzen aber Load-Execute-Varianten und sind schneller auszuführen. Vor allem, wenn die Pipeline sonst auf ein Ergebnis warten müsste, ist deren Verwendung ratsam.

Als zweitwichtigste Neuerung aus Sicht der Programmierer gibt AMD "write combining" an. Schreibzugriffe in den Speicher - welche zuerst durch die Caches müssen - können zu je 64 Byte, und damit einer Cache-Line, zusammengefasst werden. Vor allem für I/O-intensive Programme wie einen Gerätetreiber kann das viel Performance bringen. Daher hat AMD dem write combining auch einen eigenen Anhang seines Leitfadens gewidmet.

Golem Karrierewelt
  1. Entwicklung mit Unity auf der Microsoft HoloLens 2 Plattform: virtueller Zwei-Tage-Workshop
    10./11.10.2022, Virtuell
  2. Automatisierung (RPA) mit Python: virtueller Zwei-Tage-Workshop
    03./04.11.2022, Virtuell
Weitere IT-Trainings

Die Programmieranleitung ist vor allem für die Hersteller von Compilern wichtig, so dass für die Vielzahl von x86-Architekturen verschiedene Codepfade erzeugt werden können. In der Praxis kommen solche architekturspezifischen Optimierungen nur bei kleinen Teilen von Programmen zum Einsatz, können dort aber sehr effizient sein.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


konsolero 12. Apr 2011

Habe ich das richtig verstanden, dass nur die Bulldozer Prozessoren mit ausgewählten AM3...



Aktuell auf der Startseite von Golem.de
Halbleiterfertigung
Keine modernen Belichtungsmaschinen mehr für China

Maschinen für EUV-Belichtung darf ASML bereits nicht mehr nach China exportieren, auch der Zugang zu älteren DUV-Anlagen soll gekappt werden.

Halbleiterfertigung: Keine modernen Belichtungsmaschinen mehr für China
Artikel
  1. Charging Radar: Die Auslastung der Ladestationen steigt
    Charging Radar
    Die Auslastung der Ladestationen steigt

    Die Zahl der Elektroautos auf deutschen Straßen steigt. Doch der Ausbau der öffentlichen Ladeinfrastruktur lahmt, zeigt die Analyse von Charging Radar.
    Von Franz W. Rother

  2. Games with Gold: Die Xbox-360-Neuauflagen sind alle
    Games with Gold
    Die Xbox-360-Neuauflagen sind alle

    Ab Oktober 2022 ist Schluss mit weiteren Xbox-360-Spielen in Spieleabos von Microsoft. Grund ist schlicht eine natürliche Grenze.

  3. Photovoltaik: Tesla zeigt Solar-Anhänger mit Starlink-Antenne
    Photovoltaik
    Tesla zeigt Solar-Anhänger mit Starlink-Antenne

    Tesla hat auf der Ideenexpo in Hannover einen Anhänger mit ausfahrbaren Photovoltaik-Modulen nebst Starlink-Antenne vorgestellt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bestellbar • EVGA RTX 3090 24G günstig wie nie: 1.649€ • MindStar (MSI RTX 3060 429€, MSI Optix 31,5“ WQHD 165Hz 369€) • Samsung QLED 85" günstig wie nie: 1.732,72€ • Alternate (Tower-Gehäuse & CPU-Kühler v. Raijintek) • Der beste 2.000€-Gaming-PC • LG TV 65" 120Hz -56% [Werbung]
    •  /