Abo
  • IT-Karriere:

Summit Ridge: Das kann AMDs CPU-Architektur Zen

Größere Buffer sowie Caches samt Hyperthreading, skalierbar von passiv gekühlten Tablets bis hin zu Supercomputern und keine Module mehr: Die Zen-Architektur wird die Basis fast aller AMD-Prozessoren der nächsten Jahre bilden. Ein erster Überblick.

Artikel veröffentlicht am ,
Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Nachdem AMD vergangene Woche auf einem 'Konter-Event' parallel zu Intels Developer Forum erste Informationen und Benchmarks zu den kommenden CPUs namens Summit Ridge (Desktop) und Naples (Server) veröffentlicht hat, folgen diese Woche weitere Informationen: Auf der Hot Chips 28, einem Chip-Symposium in Cupertino, spricht AMDs Senior Fellow Mark Clark über weitere Details der zugrundeliegenden Zen-Mikroarchitektur.

Stellenmarkt
  1. Heise Medienwerk GmbH & Co. KG, Rostock
  2. BruderhausDiakonie - Stiftung Gustav Werner und Haus am Berg, Reutlingen

Vorneweg sei gesagt, dass allen Teilnehmern der Hot Chips die Präsentation vorliegt. Wir werden uns diese Woche vor Ort mit Mark Clark unterhalten und diese Meldung gegebenenfalls mit weiteren Einzelheiten aktualisieren - darunter fallen Fragen zur Kommunikation der Cluster, des Speichersubsystems, der erreichbaren Taktraten und Besonderheiten der Caches. Grundsätzlich sei gesagt, dass die auf dem Chip-Symposium erläuterten Details das bestätigen, was die Linux-Kernel-Patches zeigen und teils mehr Tiefe liefern.

Anders als die Bulldozer-Technik, die auf Module mit hoher Integer-Leistung und eine Gleitkomma-Einheit mit Fokus auf Befehlssatzerweiterungen wie AVX/FMA aufweist, handelt es sich bei der Zen-Architektur um einen klassischen Ansatz, der mit 'Wald- und Wiesen-Code' weitaus bessere Resultate erzielen dürfte. AMD spricht von +40 Prozent mehr Leistung pro Takt verglichen mit Excavator und von über 3 GHz für die schnellsten Desktop-Modelle mit acht Kernen.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)

Die Zen-Kerne sollen von passiv gekühlten Notebooks - also wohl Detachables - bis hin zu Supercomputern skalierbar sein. Das würde eine angebliche Roadmap bestätigen: Die spricht von 4,5 bis 95 Watt - Naples (32 Kerne) für Server sind hier allerdings außen vor. Die Grundlage aller Designs bildet ein CCX (CPU Complex), so nennt AMD einen Block aus vier Kernen samt 8 MByte L3-Cache. Zwei davon werden für Summit Ridge verwendet.

Beginnen wir klassisch beim Frontend: Die Sprungvorhersage wurde wie üblich verbessert und puffert ihre Daten in den 4-fach statt 2-fach assoziativen (weniger Cache Misses!) L1-Instruktionen-Cache mit 64 KByte oder den neuen Micro-Op-Cache. Den kennen wir von Intels Sandy Bridge, unklar bleibt aber das Fassungsvermögen - ungeachtet werden so die Recheneinheiten besser ausgelastet und die Effizienz steigt. Pro Takt kann Zen vier Instruktionen decodieren und dann immer sechs µOps an das Backend verteilen (Floating Point oder Integer oder beides gleichzeitig für eine bessere Auslastung).

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)

AMD nutzt anders als Intel eigene Scheduler für die Float- und Integer-Einheiten, was für mehr Durchsatz sorgt. Mit zwei Ports für Load/Store sowie je vier für FP und INT ist Zen breiter aufgestellt als Intels aktueller Skylake-Kern, was für SMT hilfreich sein sollte. Passend hat AMD quasi alle Buffer verglichen mit Excavator aufgebohrt, in den meisten Fällen (Scheduler, Load/Store-Queue, OoO-Fenster) liegt deren Kapazität zwischen Haswell und Skylake - da wundert es wenig, dass Zen in etwa auf dem Level von Intels Broadwell liegen soll.

Der Integer-Block besteht aus vier ALUs und zwei AGUs, wobei Letztere den nun 8-fach assoziativen und 32 KByte fassenden L1-Daten-Cache nutzen, der als schneller Write-Back- statt wie bisher als langsamerer Write-Through-Puffer konzipiert ist. Wie der L1I soll auch der L1D sehr latenzarm arbeiten, was AMD auch vom L2 behauptet. Der ist 8-fach assoziativ angebunden und 512 KByte groß, was beides eine Verdopplung verglichen mit Skylake bedeutet. Einige L2-Daten landen im exklusivem L3-(Victim-)Cache, der 8 MByte pro Quadcore fasst und mit Kerntakt läuft. Der Puffer ist in acht Blöcken organisiert, einen Last Level Cache für alle acht Kerne gibt es ergo nicht.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Die vier stärker parallelisierten Float-Ausführungseinheiten beherrschen AVX und AVX2, wobei Letzteres anders als bei Intel in zwei Zyklen (sogenannte Doubles) abgearbeitet werden muss. Für Consumer-Software spielt das vorerst keine Rolle. Ebenfalls unterstützt wird eine AES-Verschlüsselung, neu sind unter anderem RDSEED und SHA1/SHA256 sowie zwei AMD-exklusive Instruktionen. Anders als die bei Bulldozer pro Modul aufgeteilte FP-Einheit soll die neue bei einem Flush viel flotter wieder ihre Arbeit aufnehmen.

Um den Durchsatz zu steigern, kann jeder Zen-Kern per SMT zwei Threads abarbeiten, Intel nennt das Hyperthreading. Das Frontend kann daher teilweise dynamisch aufgeteilt werden, das Backend verarbeitet generell Befehle aus beiden Threads. Je nach Code dürfte durch SMT die Leistung grob um 15 bis 20 Prozent steigen; bei manchen Spielen sinkt bei Intel durch Hyperthreading die Leistung - das gilt es aber für Zen noch auszutesten.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Überblick zur SMT-Implementierung (Bild: AMD)

Unterm Strich ähnelt AMDs neue Architektur an einigen Stellen aus High-Level-Sicht, sprich oberflächlich, an Intels Haswell bis Skylake, was keinesfalls negativ auszulegen ist. Das Zen-Design wurde verglichen mit Bulldozer fast durchgehend verbreitert, die Buffer und Caches entsprechend skaliert und somit die wichtige Instruction-Level-Parallelität drastisch erhöht.

Etwaige Schwachstellen dürften sich erst im Test offenbaren, zumal die Frequenzen und Leistungsaufnahme bisher einzig grob umrissen wurden. Wir können es nur wiederholen: Es wird spannend, wie hoch Summit Ridge bei welcher TDP taktet und wie abseits der Octa- die etwaigen Quadcore-Varianten aussehen. Obendrein hat sich AMD bisher offiziell weder zum Speicherinterface noch zu den PCIe-Lanes oder dem Uncore geäußert.

Bis Anfang 2017 wird sich das und mehr aber klären.



Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de

HubertHans 29. Aug 2016

Rosinenpicken. Rendern ist nicht Rendern. Du raffst es einfach nicht, also lass es. Und...

plutoniumsulfat 25. Aug 2016

Deswegen schrieb ich ja mindestens ;) Du hast ja nur deine Plattform gepostet, nicht aber...

plutoniumsulfat 24. Aug 2016

Nein, aber 8.

plutoniumsulfat 24. Aug 2016

Wie lange ein Laptop durchhält, liegt in erster Linie am Display, nicht an der CPU.

grmpf 24. Aug 2016

Du verwechselst da was. Die Folie "Zen Microarchitecture" zeigt die Architektur eines...


Folgen Sie uns
       


Smarte Wecker im Test

Wir haben die beiden smarten Wecker Echo Show 5 von Amazon und Smart Clock von Lenovo getestet. Das Amazon-Gerät läuft mit dem digitalen Assistanten Alexa, auf dem Lenovo-Gerät läuft der Google Assistant. Beide Geräte sind weit davon entfernt, smarte Wecker zu sein.

Smarte Wecker im Test Video aufrufen
Acer Predator Thronos im Sit on: Der Nerd-Olymp
Acer Predator Thronos im Sit on
Der Nerd-Olymp

Ifa 2019 Ob wir es nun den eisernen Thron oder den Sitz der Götter nennen: Der Predator Thronos von Acer fällt auf dem Messestand des Herstellers schon auf. Golem.de konnte den skurrilen Stuhl ausprobieren. Er ist eines Gaming-Kellers würdig.
Ein Hands on von Oliver Nickel

  1. Nitro XV273X Acer baut ersten Monitor mit IPS-Panel und 240 Hz
  2. Acer Beim Predator-Notebook fährt die Tastatur wie eine Rampe aus
  3. Geräte für Mediengestalter Acer gibt Verfügbarkeit der Concept-D-Laptops bekannt

Galaxy Fold im Hands on: Samsung hat sein faltbares Smartphone gerettet
Galaxy Fold im Hands on
Samsung hat sein faltbares Smartphone gerettet

Ifa 2019 Samsungs Überarbeitungen beim Galaxy Fold haben sich gelohnt: Das Gelenk wirkt stabil und dicht, die Schutzfolie ist gut in den Rahmen eingearbeitet. Im ersten Test von Golem.de haben wir trotz aller guten Eindrücke Bedenken hinsichtlich der Kratzempfindlichkeit des Displays.
Ein Hands on von Tobias Költzsch

  1. Orbi AX6000 Netgears Wi-Fi-6-Mesh-System ist teuer
  2. Motorola Tech 3 Bluetooth-Hörstöpsel sind auch mit Kabel nutzbar
  3. Wegen US-Sanktionen Huawei bringt Mate 30 ohne Play Store und Google Maps

Garmin Fenix 6 im Test: Laufzeitmonster mit Sonne im Herzen
Garmin Fenix 6 im Test
Laufzeitmonster mit Sonne im Herzen

Bis zu 24 Tage Akkulaufzeit, im Spezialmodus sogar bis zu 120 Tage: Garmin setzt bei seiner Sport- und Smartwatchserie Fenix 6 konsequent auf Akku-Ausdauer. Beim Ausprobieren haben uns neben einem System zur Stromgewinnung auch neue Energiesparoptionen interessiert.
Ein Test von Peter Steinlechner

  1. Fenix 6 Garmins Premium-Wearable hat ein Pairing-Problem
  2. Wearable Garmin Fenix 6 bekommt Solarstrom

    •  /