Abo
  • Services:

Entwicklerleitfaden

Load/Execute soll AMDs Bulldozer schneller machen

AMD hat den Leitfaden zur Programmierung der kommenden Prozessoren mit Bulldozer-Architektur veröffentlicht. Darin enthalten ist auch eine bewertete Liste der Neuerungen, die am meisten Tempo bringen sollen.

Artikel veröffentlicht am ,
Das 'shared frontend'
Das 'shared frontend'

Galt bisher AMDs "shared frontend" als architektonisch spannendste Neuerung von AMDs Bulldozer, so sieht das der Chiphersteller selbst etwas anders. Das Unternehmen hat nun den "Software Optimization Guide" für die Bulldozer-Familie (15h laut CPUID-Befehl) als PDF veröffentlicht.

  • Das shared frontend im Detail
  • AMDs Top 12 der Bulldozer-Neuerungen für Programmierer
AMDs Top 12 der Bulldozer-Neuerungen für Programmierer
Stellenmarkt
  1. Controlware GmbH, Dietzenbach
  2. WBS GRUPPE, Berlin

Darin enthalten ist auch eine Liste der neuen Funktionen, die nach Wirksamkeit für Programmierer sortiert ist. An erster Stelle führt AMD sogenannte "Load-Execute Instructions" auf. Dabei können sowohl Integer- als auch FP-Befehle direkt nach dem Laden aus dem L1-Cache ausgeführt werden - ohne Umweg über den Scheduler. Das soll offenbar dafür sorgen, dass die gegenüber dem Frontend doppelt ausgeführten Scheduler nicht ins Leere laufen, denn nicht unter allen Bedingungen ist eine Umgehung des Schedulers sinnvoll.

So gibt es durchaus selten benutzte Befehle, die so viele Takte beanspruchen, dass eine Neusortierung durch den Scheduler sinnvoll ist. Viele Basisoperationen wie das Addieren oder Subtrahieren besitzen aber Load-Execute-Varianten und sind schneller auszuführen. Vor allem, wenn die Pipeline sonst auf ein Ergebnis warten müsste, ist deren Verwendung ratsam.

Als zweitwichtigste Neuerung aus Sicht der Programmierer gibt AMD "write combining" an. Schreibzugriffe in den Speicher - welche zuerst durch die Caches müssen - können zu je 64 Byte, und damit einer Cache-Line, zusammengefasst werden. Vor allem für I/O-intensive Programme wie einen Gerätetreiber kann das viel Performance bringen. Daher hat AMD dem write combining auch einen eigenen Anhang seines Leitfadens gewidmet.

Die Programmieranleitung ist vor allem für die Hersteller von Compilern wichtig, so dass für die Vielzahl von x86-Architekturen verschiedene Codepfade erzeugt werden können. In der Praxis kommen solche architekturspezifischen Optimierungen nur bei kleinen Teilen von Programmen zum Einsatz, können dort aber sehr effizient sein.



Anzeige
Hardware-Angebote
  1. ab 225€
  2. 199€ + Versand
  3. für 229,99€ vorbestellbar
  4. 169,90€ + Versand

konsolero 12. Apr 2011

Habe ich das richtig verstanden, dass nur die Bulldozer Prozessoren mit ausgewählten AM3...


Folgen Sie uns
       


Cinebench R20 auf Threadripper 2950X ausprobiert

Cinebench R20 soll mit bis zu 256 Threads umgehen können.

Cinebench R20 auf Threadripper 2950X ausprobiert Video aufrufen
Adblock Plus: Adblock-Filterregeln können Code ausführen
Adblock Plus
Adblock-Filterregeln können Code ausführen

Unter bestimmten Voraussetzungen können Filterregeln für Adblocker mit einer neuen Funktion Javascript-Code in Webseiten einfügen. Adblock Plus will reagieren und die entsprechende Funktion wieder entfernen. Ublock Origin ist nicht betroffen.
Von Hanno Böck

  1. Urheberrecht Axel-Springer-Verlag klagt erneut gegen Adblocker
  2. Whitelisting erlaubt Kartellamt hält Adblocker-Nutzung für "nachvollziehbar"
  3. Firefox Klar Mozilla testet offenbar Adblocker

Raspi-Tastatur und -Maus im Test: Die Basteltastatur für Bastelrechner
Raspi-Tastatur und -Maus im Test
Die Basteltastatur für Bastelrechner

Für die Raspberry-Pi-Platinen gibt es eine offizielle Tastatur und Maus, passenderweise in Weiß und Rot. Im Test macht die Tastatur einen anständigen Eindruck, die Maus hingegen hat uns eher kaltgelassen. Das Keyboard ist zudem ein guter Ausgangspunkt für Bastelprojekte.
Ein Test von Tobias Költzsch

  1. Bastelcomputer Offizielle Maus und Tastatur für den Raspberry Pi
  2. Kodi mit Raspberry Pi Pimp your Stereoanlage
  3. Betriebssystem Windows 10 on ARM kann auf Raspberry Pi 3 installiert werden

Fitbit Versa Lite im Test: Eher smartes als sportliches Wearable
Fitbit Versa Lite im Test
Eher smartes als sportliches Wearable

Sieht fast aus wie eine Apple Watch, ist aber viel günstiger: Golem.de hat die Versa Lite von Fitbit ausprobiert. Neben den Sport- und Fitnessfunktionen haben uns besonders der Appstore und das Angebot an spaßigen und ernsthaften Anwendungen interessiert.
Von Peter Steinlechner

  1. Smartwatch Fitbit stellt Versa Lite für Einsteiger vor
  2. Inspire Fitbits neues Wearable gibt es nicht im Handel
  3. Charge 3 Fitbit stellt neuen Fitness-Tracker für 150 Euro vor

    •  /