Abo
  • Services:
Anzeige
Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Summit Ridge: Das kann AMDs CPU-Architektur Zen

Ein 4-Kern-Block mit Zen-Architektur
Ein 4-Kern-Block mit Zen-Architektur (Bild: AMD)

Größere Buffer sowie Caches samt Hyperthreading, skalierbar von passiv gekühlten Tablets bis hin zu Supercomputern und keine Module mehr: Die Zen-Architektur wird die Basis fast aller AMD-Prozessoren der nächsten Jahre bilden. Ein erster Überblick.

Nachdem AMD vergangene Woche auf einem 'Konter-Event' parallel zu Intels Developer Forum erste Informationen und Benchmarks zu den kommenden CPUs namens Summit Ridge (Desktop) und Naples (Server) veröffentlicht hat, folgen diese Woche weitere Informationen: Auf der Hot Chips 28, einem Chip-Symposium in Cupertino, spricht AMDs Senior Fellow Mark Clark über weitere Details der zugrundeliegenden Zen-Mikroarchitektur.

Anzeige

Vorneweg sei gesagt, dass allen Teilnehmern der Hot Chips die Präsentation vorliegt. Wir werden uns diese Woche vor Ort mit Mark Clark unterhalten und diese Meldung gegebenenfalls mit weiteren Einzelheiten aktualisieren - darunter fallen Fragen zur Kommunikation der Cluster, des Speichersubsystems, der erreichbaren Taktraten und Besonderheiten der Caches. Grundsätzlich sei gesagt, dass die auf dem Chip-Symposium erläuterten Details das bestätigen, was die Linux-Kernel-Patches zeigen und teils mehr Tiefe liefern.

Anders als die Bulldozer-Technik, die auf Module mit hoher Integer-Leistung und eine Gleitkomma-Einheit mit Fokus auf Befehlssatzerweiterungen wie AVX/FMA aufweist, handelt es sich bei der Zen-Architektur um einen klassischen Ansatz, der mit 'Wald- und Wiesen-Code' weitaus bessere Resultate erzielen dürfte. AMD spricht von +40 Prozent mehr Leistung pro Takt verglichen mit Excavator und von über 3 GHz für die schnellsten Desktop-Modelle mit acht Kernen.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)

Die Zen-Kerne sollen von passiv gekühlten Notebooks - also wohl Detachables - bis hin zu Supercomputern skalierbar sein. Das würde eine angebliche Roadmap bestätigen: Die spricht von 4,5 bis 95 Watt - Naples (32 Kerne) für Server sind hier allerdings außen vor. Die Grundlage aller Designs bildet ein CCX (CPU Complex), so nennt AMD einen Block aus vier Kernen samt 8 MByte L3-Cache. Zwei davon werden für Summit Ridge verwendet.

Beginnen wir klassisch beim Frontend: Die Sprungvorhersage wurde wie üblich verbessert und puffert ihre Daten in den 4-fach statt 2-fach assoziativen (weniger Cache Misses!) L1-Instruktionen-Cache mit 64 KByte oder den neuen Micro-Op-Cache. Den kennen wir von Intels Sandy Bridge, unklar bleibt aber das Fassungsvermögen - ungeachtet werden so die Recheneinheiten besser ausgelastet und die Effizienz steigt. Pro Takt kann Zen vier Instruktionen decodieren und dann immer sechs µOps an das Backend verteilen (Floating Point oder Integer oder beides gleichzeitig für eine bessere Auslastung).

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)

AMD nutzt anders als Intel eigene Scheduler für die Float- und Integer-Einheiten, was für mehr Durchsatz sorgt. Mit zwei Ports für Load/Store sowie je vier für FP und INT ist Zen breiter aufgestellt als Intels aktueller Skylake-Kern, was für SMT hilfreich sein sollte. Passend hat AMD quasi alle Buffer verglichen mit Excavator aufgebohrt, in den meisten Fällen (Scheduler, Load/Store-Queue, OoO-Fenster) liegt deren Kapazität zwischen Haswell und Skylake - da wundert es wenig, dass Zen in etwa auf dem Level von Intels Broadwell liegen soll.

Der Integer-Block besteht aus vier ALUs und zwei AGUs, wobei Letztere den nun 8-fach assoziativen und 32 KByte fassenden L1-Daten-Cache nutzen, der als schneller Write-Back- statt wie bisher als langsamerer Write-Through-Puffer konzipiert ist. Wie der L1I soll auch der L1D sehr latenzarm arbeiten, was AMD auch vom L2 behauptet. Der ist 8-fach assoziativ angebunden und 512 KByte groß, was beides eine Verdopplung verglichen mit Skylake bedeutet. Einige L2-Daten landen im exklusivem L3-(Victim-)Cache, der 8 MByte pro Quadcore fasst und mit Kerntakt läuft. Der Puffer ist in acht Blöcken organisiert, einen Last Level Cache für alle acht Kerne gibt es ergo nicht.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Die vier stärker parallelisierten Float-Ausführungseinheiten beherrschen AVX und AVX2, wobei Letzteres anders als bei Intel in zwei Zyklen (sogenannte Doubles) abgearbeitet werden muss. Für Consumer-Software spielt das vorerst keine Rolle. Ebenfalls unterstützt wird eine AES-Verschlüsselung, neu sind unter anderem RDSEED und SHA1/SHA256 sowie zwei AMD-exklusive Instruktionen. Anders als die bei Bulldozer pro Modul aufgeteilte FP-Einheit soll die neue bei einem Flush viel flotter wieder ihre Arbeit aufnehmen.

Um den Durchsatz zu steigern, kann jeder Zen-Kern per SMT zwei Threads abarbeiten, Intel nennt das Hyperthreading. Das Frontend kann daher teilweise dynamisch aufgeteilt werden, das Backend verarbeitet generell Befehle aus beiden Threads. Je nach Code dürfte durch SMT die Leistung grob um 15 bis 20 Prozent steigen; bei manchen Spielen sinkt bei Intel durch Hyperthreading die Leistung - das gilt es aber für Zen noch auszutesten.

  • Mike Clark spricht über Zen (Bild: AMD)
  • Agenda des Talks auf der Hot Chips 28 (Bild: AMD)
  • Zen soll verglichen mit Excavator +40 Prozent an IPC zulegen. (Bild: AMD)
  • Die Mikroarchitektur sei sehr skalierbar. (Bild: AMD)
  • Viel schneller und viel effizienter (Bild: AMD)
  • Zusammenfassung, warum die IPC steigt (Bild: AMD)
  • Basis aller Zen-Designs ist ein Quadcore-Cluster. (Bild: AMD)
  • Das weist 64 KByte L1I, 32 KByte L1D, 512 KByte L2 und 8 MByte L3 auf. (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Fetch-Stufe (Bild: AMD)
  • Decode-Block (Bild: AMD)
  • Integer-Ausführungseinheiten (Bild: AMD)
  • Load und Store (Bild: AMD)
  • Gleitkomma-Einheit (Bild: AMD)
  • Überblick zur SMT-Implementierung (Bild: AMD)
  • Neue Instruktionen für Zen (Bild: AMD)
  • Zen+ steht bereits auf der Roadmap. (Bild: AMD)
Überblick zur SMT-Implementierung (Bild: AMD)

Unterm Strich ähnelt AMDs neue Architektur an einigen Stellen aus High-Level-Sicht, sprich oberflächlich, an Intels Haswell bis Skylake, was keinesfalls negativ auszulegen ist. Das Zen-Design wurde verglichen mit Bulldozer fast durchgehend verbreitert, die Buffer und Caches entsprechend skaliert und somit die wichtige Instruction-Level-Parallelität drastisch erhöht.

Etwaige Schwachstellen dürften sich erst im Test offenbaren, zumal die Frequenzen und Leistungsaufnahme bisher einzig grob umrissen wurden. Wir können es nur wiederholen: Es wird spannend, wie hoch Summit Ridge bei welcher TDP taktet und wie abseits der Octa- die etwaigen Quadcore-Varianten aussehen. Obendrein hat sich AMD bisher offiziell weder zum Speicherinterface noch zu den PCIe-Lanes oder dem Uncore geäußert.

Bis Anfang 2017 wird sich das und mehr aber klären.


eye home zur Startseite
HubertHans 29. Aug 2016

Rosinenpicken. Rendern ist nicht Rendern. Du raffst es einfach nicht, also lass es. Und...

plutoniumsulfat 25. Aug 2016

Deswegen schrieb ich ja mindestens ;) Du hast ja nur deine Plattform gepostet, nicht aber...

plutoniumsulfat 24. Aug 2016

Nein, aber 8.

plutoniumsulfat 24. Aug 2016

Wie lange ein Laptop durchhält, liegt in erster Linie am Display, nicht an der CPU.

grmpf 24. Aug 2016

Du verwechselst da was. Die Folie "Zen Microarchitecture" zeigt die Architektur eines...



Anzeige

Stellenmarkt
  1. item Industrietechnik GmbH, Solingen
  2. IKA-Werke GmbH & Co. KG, Staufen
  3. Device Insight GmbH, München
  4. K+S Aktiengesellschaft, Kassel


Anzeige
Top-Angebote
  1. (u. a. John Wick, Bastille Day, Sicario, Leon der Profi)
  2. 556,03€
  3. 19,00€ (nur für Prime-Kunden!)

Folgen Sie uns
       


  1. Google

    Alphabet macht weit über 5 Milliarden Dollar Gewinn

  2. Quartalsbericht

    Microsofts Zukunft ist erfolgreich in die Cloud verschoben

  3. Quartalsbericht

    Amazon macht erneut riesigen Gewinn

  4. Datenschutzverordnung im Bundestag

    "Für uns ist jeden Tag der Tag der inneren Sicherheit"

  5. Aspire-Serie

    Acer stellt Notebooks für jeden Geldbeutel vor

  6. Acer Predator Triton 700

    Das Fenster oberhalb der Tastatur ist ein Clickpad

  7. Kollaborationsserver

    Owncloud 10 verbessert Gruppen- und Gästenutzung

  8. Panoramafreiheit

    Aidas Kussmund darf im Internet veröffentlicht werden

  9. id Software

    Nächste id Tech setzt massiv auf FP16-Berechnungen

  10. Broadcom-Sicherheitslücken

    Samsung schützt Nutzer nicht vor WLAN-Angriffen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Mobile-Games-Auslese: Untote Rundfahrt und mobiles Seemannsgarn
Mobile-Games-Auslese
Untote Rundfahrt und mobiles Seemannsgarn
  1. Spielebranche Beschäftigtenzahl in der deutschen Spielebranche sinkt
  2. Pay-by-Call Eltern haften nicht für unerlaubte Telefonkäufe der Kinder
  3. Spielebranche Deutscher Gamesmarkt war 2016 stabil

Elektromobilität: Wie kommt der Strom in die Tiefgarage?
Elektromobilität
Wie kommt der Strom in die Tiefgarage?
  1. Elektroauto VW testet E-Trucks
  2. Elektroauto Opel Ampera-E kostet inklusive Prämie ab 34.950 Euro
  3. Elektroauto Volkswagen I.D. Crozz soll als Crossover autonom fahren

Quantencomputer: Alleskönner mit Grenzen
Quantencomputer
Alleskönner mit Grenzen

  1. Die Werbekunden kommen wieder

    Sharra | 03:50

  2. Re: Sinn?

    Ach | 02:55

  3. Re: Schon lustig

    ibecf | 02:50

  4. Re: Die Geister die er rief...

    Keepo | 02:45

  5. Re: Raucherpausen

    Keepo | 02:39


  1. 00:11

  2. 23:21

  3. 22:37

  4. 20:24

  5. 18:00

  6. 18:00

  7. 17:42

  8. 17:23


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel