Abo
  • Services:
Anzeige
Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Summit Ridge: Das kann AMDs CPU-Architektur Zen

Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Größere Buffer sowie Caches samt Hyperthreading, skalierbar von passiv gekühlten Tablets bis hin zu Supercomputern und keine Module mehr: Die Zen-Architektur wird die Basis fast aller AMD-Prozessoren der nächsten Jahre bilden. Ein erster Überblick.

Nachdem AMD vergangene Woche auf einem 'Konter-Event' parallel zu Intels Developer Forum erste Informationen und Benchmarks zu den kommenden CPUs namens Summit Ridge (Desktop) und Naples (Server) veröffentlicht hat, folgen diese Woche weitere Informationen: Auf der Hot Chips 28, einem Chip-Symposium in Cupertino, spricht AMDs Senior Fellow Mark Clark über weitere Details der zugrundeliegenden Zen-Mikroarchitektur.

Anzeige

Vorneweg sei gesagt, dass allen Teilnehmern der Hot Chips die Präsentation vorliegt. Wir werden uns diese Woche vor Ort mit Mark Clark unterhalten und diese Meldung gegebenenfalls mit weiteren Einzelheiten aktualisieren - darunter fallen Fragen zur Kommunikation der Cluster, des Speichersubsystems, der erreichbaren Taktraten und Besonderheiten der Caches. Grundsätzlich sei gesagt, dass die auf dem Chip-Symposium erläuterten Details das bestätigen, was die Linux-Kernel-Patches zeigen und teils mehr Tiefe liefern.

Anders als die Bulldozer-Technik, die auf Module mit hoher Integer-Leistung und eine Gleitkomma-Einheit mit Fokus auf Befehlssatzerweiterungen wie AVX/FMA aufweist, handelt es sich bei der Zen-Architektur um einen klassischen Ansatz, der mit 'Wald- und Wiesen-Code' weitaus bessere Resultate erzielen dürfte. AMD spricht von +40 Prozent mehr Leistung pro Takt verglichen mit Excavator und von über 3 GHz für die schnellsten Desktop-Modelle mit acht Kernen.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)

Die Zen-Kerne sollen von passiv gekühlten Notebooks - also wohl Detachables - bis hin zu Supercomputern skalierbar sein. Das würde eine angebliche Roadmap bestätigen: Die spricht von 4,5 bis 95 Watt - Naples (32 Kerne) für Server sind hier allerdings außen vor. Die Grundlage aller Designs bildet ein CCX (CPU Complex), so nennt AMD einen Block aus vier Kernen samt 8 MByte L3-Cache. Zwei davon werden für Summit Ridge verwendet.

Beginnen wir klassisch beim Frontend: Die Sprungvorhersage wurde wie üblich verbessert und puffert ihre Daten in den 4-fach statt 2-fach assoziativen (weniger Cache Misses!) L1-Instruktionen-Cache mit 64 KByte oder den neuen Micro-Op-Cache. Den kennen wir von Intels Sandy Bridge, unklar bleibt aber das Fassungsvermögen - ungeachtet werden so die Recheneinheiten besser ausgelastet und die Effizienz steigt. Pro Takt kann Zen vier Instruktionen decodieren und dann immer sechs µOps an das Backend verteilen (Floating Point oder Integer oder beides gleichzeitig für eine bessere Auslastung).

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)

AMD nutzt anders als Intel eigene Scheduler für die Float- und Integer-Einheiten, was für mehr Durchsatz sorgt. Mit zwei Ports für Load/Store sowie je vier für FP und INT ist Zen breiter aufgestellt als Intels aktueller Skylake-Kern, was für SMT hilfreich sein sollte. Passend hat AMD quasi alle Buffer verglichen mit Excavator aufgebohrt, in den meisten Fällen (Scheduler, Load/Store-Queue, OoO-Fenster) liegt deren Kapazität zwischen Haswell und Skylake - da wundert es wenig, dass Zen in etwa auf dem Level von Intels Broadwell liegen soll.

Der Integer-Block besteht aus vier ALUs und zwei AGUs, wobei Letztere den nun 8-fach assoziativen und 32 KByte fassenden L1-Daten-Cache nutzen, der als schneller Write-Back- statt wie bisher als langsamerer Write-Through-Puffer konzipiert ist. Wie der L1I soll auch der L1D sehr latenzarm arbeiten, was AMD auch vom L2 behauptet. Der ist 8-fach assoziativ angebunden und 512 KByte groß, was beides eine Verdopplung verglichen mit Skylake bedeutet. Einige L2-Daten landen im exklusivem L3-(Victim-)Cache, der 8 MByte pro Quadcore fasst und mit Kerntakt läuft. Der Puffer ist in acht Blöcken organisiert, einen Last Level Cache für alle acht Kerne gibt es ergo nicht.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Die vier stärker parallelisierten Float-Ausführungseinheiten beherrschen AVX und AVX2, wobei Letzteres anders als bei Intel in zwei Zyklen (sogenannte Doubles) abgearbeitet werden muss. Für Consumer-Software spielt das vorerst keine Rolle. Ebenfalls unterstützt wird eine AES-Verschlüsselung, neu sind unter anderem RDSEED und SHA1/SHA256 sowie zwei AMD-exklusive Instruktionen. Anders als die bei Bulldozer pro Modul aufgeteilte FP-Einheit soll die neue bei einem Flush viel flotter wieder ihre Arbeit aufnehmen.

Um den Durchsatz zu steigern, kann jeder Zen-Kern per SMT zwei Threads abarbeiten, Intel nennt das Hyperthreading. Das Frontend kann daher teilweise dynamisch aufgeteilt werden, das Backend verarbeitet generell Befehle aus beiden Threads. Je nach Code dürfte durch SMT die Leistung grob um 15 bis 20 Prozent steigen; bei manchen Spielen sinkt bei Intel durch Hyperthreading die Leistung - das gilt es aber für Zen noch auszutesten.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Überblick zur SMT-Implementierung (Bild: AMD)

Unterm Strich ähnelt AMDs neue Architektur an einigen Stellen aus High-Level-Sicht, sprich oberflächlich, an Intels Haswell bis Skylake, was keinesfalls negativ auszulegen ist. Das Zen-Design wurde verglichen mit Bulldozer fast durchgehend verbreitert, die Buffer und Caches entsprechend skaliert und somit die wichtige Instruction-Level-Parallelität drastisch erhöht.

Etwaige Schwachstellen dürften sich erst im Test offenbaren, zumal die Frequenzen und Leistungsaufnahme bisher einzig grob umrissen wurden. Wir können es nur wiederholen: Es wird spannend, wie hoch Summit Ridge bei welcher TDP taktet und wie abseits der Octa- die etwaigen Quadcore-Varianten aussehen. Obendrein hat sich AMD bisher offiziell weder zum Speicherinterface noch zu den PCIe-Lanes oder dem Uncore geäußert.

Bis Anfang 2017 wird sich das und mehr aber klären.


eye home zur Startseite
HubertHans 29. Aug 2016

Rosinenpicken. Rendern ist nicht Rendern. Du raffst es einfach nicht, also lass es. Und...

plutoniumsulfat 25. Aug 2016

Deswegen schrieb ich ja mindestens ;) Du hast ja nur deine Plattform gepostet, nicht aber...

plutoniumsulfat 24. Aug 2016

Nein, aber 8.

plutoniumsulfat 24. Aug 2016

Wie lange ein Laptop durchhält, liegt in erster Linie am Display, nicht an der CPU.

grmpf 24. Aug 2016

Du verwechselst da was. Die Folie "Zen Microarchitecture" zeigt die Architektur eines...



Anzeige

Stellenmarkt
  1. Daimler AG, Sindelfingen
  2. bielomatik Leuze GmbH & Co. KG, Neuffen
  3. Birkenstock GmbH & Co. KG Services, Neustadt (Wied)
  4. Vorwerk & Co. KG, Wuppertal


Anzeige
Blu-ray-Angebote
  1. für 1€ über Sky Ticket (via App auch auf Smartphone/Tablet, Apple TV, PS3, PS4, Xbox One...
  2. (u. a. Der Marsianer 8,79€, Blade Runner 8,97€, Interstellar 8,74€, X-Men Apocalypse 8,79€)
  3. 299,99€ (Vorbesteller-Preisgarantie)

Folgen Sie uns
       


  1. Umweltbundesamt

    Software-Updates für Diesel reichen nicht

  2. Acer Nitro 5 Spin

    Auf dem Gaming-Convertible spielen und zeichnen

  3. Galaxy Note 8 im Hands on

    Auch das Galaxy Note sieht jetzt doppelt - für 1.000 Euro

  4. Microsoft

    Git-Umzug von Windows-Team abgeschlossen

  5. Play Store

    Google entfernt 500 Android-Apps mit 100 Millionen Downloads

  6. DreamHost

    US-Regierung will nun doch keine Daten von Trump-Gegnern

  7. Project Brainwave

    Microsoft beschleunigt KI-Technik mit Cloud-FPGAs

  8. Microsoft

    Im Windows Store gibt es viele illegale Streaming-Apps

  9. Alpha-One

    Lamborghini-Smartphone für über 2.000 Euro vorgestellt

  10. Wireless-AC 9560

    Intel packt WLAN in den Prozessor



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Fujitsu Lifebook U937 im Test: 976 Gramm reichen für das fast perfekte Notebook
Fujitsu Lifebook U937 im Test
976 Gramm reichen für das fast perfekte Notebook
  1. DLU Fujitsu entwickelt Deep-Learning-Chips

Game of Thrones: Die Kunst, Fiktion mit Wirklichkeit zu verschmelzen
Game of Thrones
Die Kunst, Fiktion mit Wirklichkeit zu verschmelzen
  1. HBO Nächste Episode von Game of Thrones geleakt
  2. Hack Game-of-Thrones-Skript von HBO geleakt
  3. Game of Thrones "Der Winter ist da und hat leider unsere Server eingefroren"

Schifffahrt: Yara Birkeland wird der erste autonome E-Frachter
Schifffahrt
Yara Birkeland wird der erste autonome E-Frachter
  1. Sea Bubbles Tragflächen-Elektroboote kommen nach Paris
  2. Honolulu Strafe für Handynutzung auf der Straße
  3. Yara Birkeland Autonomes Containerschiff soll elektrisch fahren

  1. Re: alte Lasermaus

    Shik3i | 04:49

  2. Und es ist eher unattraktiv

    watwerbisdudenn | 04:32

  3. Re: Sind 1000 Euro nicht zu teuer?

    mcmrc1 | 03:38

  4. Re: Nur für Rechtshänder?

    quasides | 03:01

  5. Re: Hoffentlich läufts in 1080p auf Raven-Ridge

    LinuxMcBook | 02:49


  1. 17:51

  2. 17:08

  3. 17:00

  4. 16:55

  5. 16:38

  6. 16:08

  7. 15:54

  8. 14:51


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel