Zum Hauptinhalt Zur Navigation

AMDs K10-Prozessoren kommen mit Befehlssatz "SSE4a"

Neue Instruktionen für 128-Bit-Einheiten. Seit kurzem hat AMD die Erweiterungen der K10-Architektur für Programmierer dokumentiert. Darin taucht auch ein bisher nicht bekannter Befehlssatz namens "SSE4a" auf. Wie AMD gegenüber Golem.de erklärte, handelt es sich um Erweiterungen, die auf SSE3 aufsetzen, nicht um eine neue Version des von Intel noch nicht in den Markt eingeführten SSE4.
/ Nico Ernst
66 Kommentare News folgen (öffnet im neuen Fenster)

Für das dritte Quartal 2007 hat Intel mit dem "Penryn"-Kern eine neue Ausgabe der Core-Architektur angekündigt, die laut ersten Benchmarks vor allem durch größere Caches und den neuen SSE4-Befehlssatz deutlich schneller rechnen soll. Mit SSE4 ziehen 47 neue Befehle in die kommenden Prozessoren ein, AMD rüstet die Intel-Befehlssätze in der Regel in der jeweils nächsten Überarbeitung eines Kerns nach.

Im "Software Optimization Guide" ( PDF(öffnet im neuen Fenster) ) für die K10-Architektur taucht nun jedoch schon "SSE4a" auf, das der Beschreibung der Instruktionen nach zu urteilen ganz auf die 128-Bit-Rechenwerke von K10 ausgerichtet ist. Wie berichtet , bringen die K10-Kerne SSE-Einheiten mit, die Daten und Instruktionen mit 128 Bit Breite über einen ebenso weiten Bus entgegennehmen können. AMD verspricht sich davon bei bestimmten Anwendungen eine Leistungssteigerung von bis zu 80 Prozent, auch Intel hatte mit seinen ersten Tests ähnliche Werte mit SSE4-optimiertem Code erreichen können, etwa bei einer Beta-Version von Divx 6.6.

Wie AMD jedoch gegenüber Golem.de angab, setzt der bei AMD "SSE4a" genannte Befehlssatz auf Intels SSE3 auf, die SSE4-Befehle des Penryns können die ersten K10-Prozessoren noch nicht verarbeiten. Für den Namen hat man sich entschieden, weil die Befehle die 128-Bit-Einheiten nutzbar machen. Damit dürfte die Verwirrung bei den Programmierern komplett sein, die sich nun in der zweiten Hälfte des Jahres 2007 auf zwei neue Erweiterungen einstellen müssen. So sich die sowohl von Intel wie AMD versprochenen Leistungssteigerungen in der Realität auch zeigen, kommt es bei der Wahl einer rechenintensiven Software wie beispielsweise der Medienverarbeitung auch beim Anwender in Zukunft noch stärker darauf an, auf welche CPU-Architektur die Programme optimiert sind. Sofern die Anpassungen in der Dokumentation von Anwendungen überhaupt angegeben sind, gilt es, zwischen "SSE4" (Intel-Prozessoren ab Penryn) und "SSE4a" (AMD-Prozessoren ab Barcelona) zu unterscheiden.

Ob und wann Intel die SSE4a-Befehle bei seinen Prozessoren nachrüstet, ist noch nicht bekannt. Da beide Unternehmen ein Abkommen über einen vollständigen Patentaustausch haben, ist das jedoch prinzipiell möglich.


Relevante Themen