Abo
  • Services:
Anzeige
Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Summit Ridge: Das kann AMDs CPU-Architektur Zen

Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Größere Buffer sowie Caches samt Hyperthreading, skalierbar von passiv gekühlten Tablets bis hin zu Supercomputern und keine Module mehr: Die Zen-Architektur wird die Basis fast aller AMD-Prozessoren der nächsten Jahre bilden. Ein erster Überblick.

Nachdem AMD vergangene Woche auf einem 'Konter-Event' parallel zu Intels Developer Forum erste Informationen und Benchmarks zu den kommenden CPUs namens Summit Ridge (Desktop) und Naples (Server) veröffentlicht hat, folgen diese Woche weitere Informationen: Auf der Hot Chips 28, einem Chip-Symposium in Cupertino, spricht AMDs Senior Fellow Mark Clark über weitere Details der zugrundeliegenden Zen-Mikroarchitektur.

Anzeige

Vorneweg sei gesagt, dass allen Teilnehmern der Hot Chips die Präsentation vorliegt. Wir werden uns diese Woche vor Ort mit Mark Clark unterhalten und diese Meldung gegebenenfalls mit weiteren Einzelheiten aktualisieren - darunter fallen Fragen zur Kommunikation der Cluster, des Speichersubsystems, der erreichbaren Taktraten und Besonderheiten der Caches. Grundsätzlich sei gesagt, dass die auf dem Chip-Symposium erläuterten Details das bestätigen, was die Linux-Kernel-Patches zeigen und teils mehr Tiefe liefern.

Anders als die Bulldozer-Technik, die auf Module mit hoher Integer-Leistung und eine Gleitkomma-Einheit mit Fokus auf Befehlssatzerweiterungen wie AVX/FMA aufweist, handelt es sich bei der Zen-Architektur um einen klassischen Ansatz, der mit 'Wald- und Wiesen-Code' weitaus bessere Resultate erzielen dürfte. AMD spricht von +40 Prozent mehr Leistung pro Takt verglichen mit Excavator und von über 3 GHz für die schnellsten Desktop-Modelle mit acht Kernen.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)

Die Zen-Kerne sollen von passiv gekühlten Notebooks - also wohl Detachables - bis hin zu Supercomputern skalierbar sein. Das würde eine angebliche Roadmap bestätigen: Die spricht von 4,5 bis 95 Watt - Naples (32 Kerne) für Server sind hier allerdings außen vor. Die Grundlage aller Designs bildet ein CCX (CPU Complex), so nennt AMD einen Block aus vier Kernen samt 8 MByte L3-Cache. Zwei davon werden für Summit Ridge verwendet.

Beginnen wir klassisch beim Frontend: Die Sprungvorhersage wurde wie üblich verbessert und puffert ihre Daten in den 4-fach statt 2-fach assoziativen (weniger Cache Misses!) L1-Instruktionen-Cache mit 64 KByte oder den neuen Micro-Op-Cache. Den kennen wir von Intels Sandy Bridge, unklar bleibt aber das Fassungsvermögen - ungeachtet werden so die Recheneinheiten besser ausgelastet und die Effizienz steigt. Pro Takt kann Zen vier Instruktionen decodieren und dann immer sechs µOps an das Backend verteilen (Floating Point oder Integer oder beides gleichzeitig für eine bessere Auslastung).

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)

AMD nutzt anders als Intel eigene Scheduler für die Float- und Integer-Einheiten, was für mehr Durchsatz sorgt. Mit zwei Ports für Load/Store sowie je vier für FP und INT ist Zen breiter aufgestellt als Intels aktueller Skylake-Kern, was für SMT hilfreich sein sollte. Passend hat AMD quasi alle Buffer verglichen mit Excavator aufgebohrt, in den meisten Fällen (Scheduler, Load/Store-Queue, OoO-Fenster) liegt deren Kapazität zwischen Haswell und Skylake - da wundert es wenig, dass Zen in etwa auf dem Level von Intels Broadwell liegen soll.

Der Integer-Block besteht aus vier ALUs und zwei AGUs, wobei Letztere den nun 8-fach assoziativen und 32 KByte fassenden L1-Daten-Cache nutzen, der als schneller Write-Back- statt wie bisher als langsamerer Write-Through-Puffer konzipiert ist. Wie der L1I soll auch der L1D sehr latenzarm arbeiten, was AMD auch vom L2 behauptet. Der ist 8-fach assoziativ angebunden und 512 KByte groß, was beides eine Verdopplung verglichen mit Skylake bedeutet. Einige L2-Daten landen im exklusivem L3-(Victim-)Cache, der 8 MByte pro Quadcore fasst und mit Kerntakt läuft. Der Puffer ist in acht Blöcken organisiert, einen Last Level Cache für alle acht Kerne gibt es ergo nicht.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Die vier stärker parallelisierten Float-Ausführungseinheiten beherrschen AVX und AVX2, wobei Letzteres anders als bei Intel in zwei Zyklen (sogenannte Doubles) abgearbeitet werden muss. Für Consumer-Software spielt das vorerst keine Rolle. Ebenfalls unterstützt wird eine AES-Verschlüsselung, neu sind unter anderem RDSEED und SHA1/SHA256 sowie zwei AMD-exklusive Instruktionen. Anders als die bei Bulldozer pro Modul aufgeteilte FP-Einheit soll die neue bei einem Flush viel flotter wieder ihre Arbeit aufnehmen.

Um den Durchsatz zu steigern, kann jeder Zen-Kern per SMT zwei Threads abarbeiten, Intel nennt das Hyperthreading. Das Frontend kann daher teilweise dynamisch aufgeteilt werden, das Backend verarbeitet generell Befehle aus beiden Threads. Je nach Code dürfte durch SMT die Leistung grob um 15 bis 20 Prozent steigen; bei manchen Spielen sinkt bei Intel durch Hyperthreading die Leistung - das gilt es aber für Zen noch auszutesten.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Überblick zur SMT-Implementierung (Bild: AMD)

Unterm Strich ähnelt AMDs neue Architektur an einigen Stellen aus High-Level-Sicht, sprich oberflächlich, an Intels Haswell bis Skylake, was keinesfalls negativ auszulegen ist. Das Zen-Design wurde verglichen mit Bulldozer fast durchgehend verbreitert, die Buffer und Caches entsprechend skaliert und somit die wichtige Instruction-Level-Parallelität drastisch erhöht.

Etwaige Schwachstellen dürften sich erst im Test offenbaren, zumal die Frequenzen und Leistungsaufnahme bisher einzig grob umrissen wurden. Wir können es nur wiederholen: Es wird spannend, wie hoch Summit Ridge bei welcher TDP taktet und wie abseits der Octa- die etwaigen Quadcore-Varianten aussehen. Obendrein hat sich AMD bisher offiziell weder zum Speicherinterface noch zu den PCIe-Lanes oder dem Uncore geäußert.

Bis Anfang 2017 wird sich das und mehr aber klären.


eye home zur Startseite
HubertHans 29. Aug 2016

Rosinenpicken. Rendern ist nicht Rendern. Du raffst es einfach nicht, also lass es. Und...

plutoniumsulfat 25. Aug 2016

Deswegen schrieb ich ja mindestens ;) Du hast ja nur deine Plattform gepostet, nicht aber...

plutoniumsulfat 24. Aug 2016

Nein, aber 8.

plutoniumsulfat 24. Aug 2016

Wie lange ein Laptop durchhält, liegt in erster Linie am Display, nicht an der CPU.

grmpf 24. Aug 2016

Du verwechselst da was. Die Folie "Zen Microarchitecture" zeigt die Architektur eines...



Anzeige

Stellenmarkt
  1. Veridos GmbH, München
  2. operational services GmbH & Co. KG, Wolfsburg, Braunschweig, Zwickau
  3. ResMed, Martinsried Raum München
  4. Robert Bosch GmbH, Schwieberdingen


Anzeige
Hardware-Angebote
  1. 84,90€

Folgen Sie uns
       


  1. UEFI-Update

    Agesa 1004a lässt Ryzen-Boards schneller booten

  2. Sledgehammer Games

    Call of Duty WWII spielt wieder im Zweiten Weltkrieg

  3. Mobilfunk

    Patentverwerter klagt gegen Apple und Mobilfunkanbieter

  4. Privatsphäre

    Bildungsrechner spionieren Schüler aus

  5. Raumfahrt

    Chinesischer Raumfrachter Tanzhou 1 dockt an Raumstation an

  6. Die Woche im Video

    Kein Saft, kein Wumms, keine Argumente

  7. Windows 7 und 8

    Github-Nutzer schafft Freischaltung von neuen CPUs

  8. Whitelist umgehen

    Node-Server im Nvidia-Treiber ermöglicht Malware-Ausführung

  9. Easy S und Easy M

    Vodafone stellt günstige Einsteigertarife ohne LTE vor

  10. UP2718Q

    Dell verkauft HDR10-Monitor ab Mai 2017



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Fire TV Stick 2 im Test: Der Stick macht den normalen Fire TV (fast) überflüssig
Fire TV Stick 2 im Test
Der Stick macht den normalen Fire TV (fast) überflüssig
  1. Streaming Amazon bringt Alexa auch auf ältere Fire-TV-Geräte
  2. Streaming Amazon plant Fire TV mit 4K- und HDR-Unterstützung
  3. Fire TV Stick 2 mit Alexa im Hands on Amazons attraktiver Einstieg in die Streaming-Welt

Garmin Fenix 5 im Test: Die Minimap am Handgelenk
Garmin Fenix 5 im Test
Die Minimap am Handgelenk

Trutzbox Apu 2 im Test: Gute Privacy-Box mit kleiner Basteleinlage
Trutzbox Apu 2 im Test
Gute Privacy-Box mit kleiner Basteleinlage
  1. Malware Schadsoftware bei 1.200 Holiday-Inn- und Crowne-Plaza-Hotels
  2. Zero Day Exploit Magento-Onlineshops sind wieder gefährdet
  3. Staatstrojaner Office 0-Day zur Verbreitung von Finfisher-Trojaner genutzt

  1. Re: Bitte nicht die Pressemitteilung völlig...

    cimst | 17:49

  2. Re: ww2 ist langweilig

    ArchLInux | 17:41

  3. Re: Call of Battlefield ....

    medium_quelle | 17:35

  4. Re: Vllt mal die deutsche Seite spielen?

    144Neodym | 17:32

  5. Re: Steuerrecht

    NutzlastBaer | 17:29


  1. 12:40

  2. 11:55

  3. 15:19

  4. 13:40

  5. 11:00

  6. 09:03

  7. 18:01

  8. 17:08


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel