• IT-Karriere:
  • Services:

Zen-2-Architektur erklärt

Für die Ryzen 3000 verwendet AMD innerhalb der CPU-Chiplets eine verbesserte Technik, denn auf Zen(+) folgt Zen 2. Das grundlegende Konstrukt bleibt gleich: Zwei CCX (Core Complex) mit je vier Kernen bilden gemeinsam mit dem L3-Cache einen Prozessor-Chip. Durch den Shrink von 14/12 nm auf 7 nm konnte AMD die dritte Puffer-Stufe von 8 MByte pro CCX auf 16 MByte verdoppeln, ein achtkerniges Chiplet hat daher satte 32 MByte. Zwar steigt die Latenz des L3-Cache leicht an, die Datenlokalität und der Durchsatz aber werden erhöht. Will ein CCX mit einem CCX kommunizieren, wird das externe I/O-Die statt des internen Fabrics verwendet. Das erhöht zwar die Latenz, vereinfacht aber die Kontrolllogik stark.

Stellenmarkt
  1. Kommunale Versorgungskassen Westfalen-Lippe, Münster
  2. consistec Engineering & Consulting GmbH, Saarbrücken

Im Frontend hat AMD die bekannte Perceptron-basierte Sprungvorhersage verbessert, um Daten in den L1-Instruktionen-Cache zu laden, zusätzlich wurde auch eine Tage-Sprungvorhersage umgesetzt: Das steht für Tagged Geometric History Length und gilt als eine der derzeit fortschrittlichsten Methoden für eine Branch-Prediction. AMD spricht in Kombination mit den massiv vergrößerten Branch-Target-Buffern (BTBs) von einer 30 Prozent verringerten Miss-Rate, was maßgeblich für eine hohe CPU-Geschwindigkeit ist. Andere Designs mit einer Tage-Sprungvorhersage sind unter anderem der Boom 2, ein RISC-V-Kern, und der Xiaomi-Core in Phytiums Mars, ein ARM-Chip.

Der L1-Instruktionen-Cache wurde von AMD von 64 KByte auf 32 KByte halbiert, was im ersten Moment kurios erscheinen mag. Allerdings hat sich die Assoziativität von 4-fach auf 8-fach verdoppelt, was die Hit-Rate im Puffer hoch hält und für eine bessere Taktbarkeit sowie optimierte SMT-Leistung sorgen soll. Vor allem aber schafft der kleinere L1I den Platz, um das Fassungsvermögen des Micro-Op-Cache von 2.048 auf 4.096 Einträge zu erhöhen. Das hilft, die Performance bei niedriger Leistungsaufnahme zu steigern, weil so Instruktionen nicht erst decodiert, sondern wiederverwendet werden können. Intels Micro-Op-Cache hat bisher 1.536 Einträge.

  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • Der Ryzen 9 3900X ist vorerst AMDs Mainstream-Topmodell. (Bild: Marc Sauter/Golem.de)
  • Alle Matisse unterstützen DDR4-3200. (Bild: Martin Wolf/Golem.de)
  • Matisse ist bereits die vierte CPU-Generation für den Sockel AM4. (Bild: AMD)
  • Matisse besteht intern aus mindestens zwei Chips, als 12- oder 16-Kerner aus drei. (Bild: AMD)
  • Ein I/O-Die versorgt bis zu zwei Compute-Dies mit Daten. (Bild: AMD)
  • Damit die unterschiedlichen Chips auf einen Träger passen, braucht es ein aufwendiges Packaging. (Bild: AMD)
  • Das 12-schichtige Substrat war eine Herausforderung, da drei Dies samt PCIe Gen4 nach außen geführt wird. (Bild: AMD)
  • Blockdiagramm eines Systems mit Ryzen 3000 und X570 (Bild: AMD)
  • Vergleich der Schnittstellen einer Matisse-CPU sowie des X570 und Intels Z390 (Bild: AMD)
  • Bei den Ryzen 3000 ist Fabric-Takt von der DDR4-Frequenz entkopppelt. (Bild: AMD)
  • Überblick eines Zen-2-Kerns (Bild: AMD)
  • Decode-Stufe eines Zen-2-Kerns (Bild: AMD)
  • Gleitkomma-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Integer-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Load/Store-Block eines Zen-2-Kerns (Bild: AMD)
  • Zen 2 unterstützt neue Instruktionen. (Bild: AMD)
  • Die Leistung pro Takt soll 15 Prozent höher liegen. (Bild: AMD)
  • Neben der IPC beschleunigt 7 nm die Frequenz für mehr Geschwindigkeit. (Bild: AMD)
  • Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)
  • Die Corsair MP600 ist eine der ersten PCIe-Gen4-SSDs. (Bild: Marc Sauter/Golem.de)
  • Wie alle anderen Modelle auch basiert sie auf dem E16-Controller von Phison. (Bild: Marc Sauter/Golem.de)
  • Die sequenzielle Lese- und Schreibrate ist extrem hoch, die restlichen Werte kaum besser als bei einer PCIe-Gen3-SSD. (Bild: Golem.de)
  • Der Atto-Benchmark bestätigt die Leistungswerte der Corsair MP600. (Bild: Golem.de)
  • Windows 10 v1903 hat einen verbesserten Scheduler und und unterstützt ein schnelleres Hochtakten. (Bild: AMD)
  • Das steigert die Leistung in einigen Spielen und bei Burst-Workloads wie dem Starten von Apps. (Bild: AMD)
  • Ryzen 9 3900X übertaktet auf 4,35 GHz. (Bild: Golem.de)
  • Precision Boost Overdrive erhöht den Takt automatisch um 200 MHz. (Bild: Golem.de)
Überblick eines Zen-2-Kerns (Bild: AMD)

Wie gehabt decodiert auch Zen 2 bis zu vier Instruktionen pro Takt, wobei der Decoder zusammen mit dem Micro-Op-Cache weiterhin bis zu sechs Befehle an die Ausführungseinheiten senden kann; der Reorder-Buffer zur Berechnungsreihenfolge der Instruktionen wurde von 192 auf 224 Einträge erweitert. Der Integer-Register-File nimmt 180 statt 168 Einträge auf, zudem gibt es nun einen 7-fachen statt 6-fachen Scheduler. Die vier ALUs bleiben erhalten, AMD hat aber eine dritte Adresseinheit (Store-AGU) hinzugefügt, welche die Lade-/Speichereinheiten besser auslastet. Deren Bandbreite hat AMD von 16 KByte auf 32 KByte pro Takt verdoppelt, dahinter sitzt der nun doppelt so schnelle L1-Daten-Cache samt größeren Buffern.

Beim Gleitkomma-Block wurde die Bandbreite ebenfalls verdoppelt, denn die vier SIMD-Einheiten arbeiten nun mit 256 Bit statt mit 128 Bit. Die Pipelines können AVX2-Befehle daher in einem Takt abarbeiten, was sich mit dem synthetischen FPU-Julia-Benchmark von Aida64 schön aufzeigen lässt: Ein Ryzen 7 3700X erreicht fast doppelt so viele FP32-Flops wie ein Ryzen 7 2700X. Von der doppelten AVX2-Geschwindigkeit profitiert primär Software wie Blender und H.265-Encoding, aber auch einige Spiele legen zu. AMD betonte, dass die Latenz für Gleitkomma-Multiplikationen von vier auf drei Takte reduziert wurde.

Alles in allem nennt der Hersteller eine um 15 Prozent verbesserte Leistung pro Takt (IPC) verglichen mit Zen+, also der Architektur der Ryzen 2000 alias Pinnacle Ridge. Dieser Wert schwankt allerdings stark abhängig von der verwendeten Software, zudem hat AMD den Ryzen 3000 abseits schnellerer Kerne auch noch Optimierungen beim Fabric, dem generellen Aufbau mit dem I/O-Die und einen flotteren DDR4-Speicher verpasst.

  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • Der Ryzen 9 3900X ist vorerst AMDs Mainstream-Topmodell. (Bild: Marc Sauter/Golem.de)
  • Alle Matisse unterstützen DDR4-3200. (Bild: Martin Wolf/Golem.de)
  • Matisse ist bereits die vierte CPU-Generation für den Sockel AM4. (Bild: AMD)
  • Matisse besteht intern aus mindestens zwei Chips, als 12- oder 16-Kerner aus drei. (Bild: AMD)
  • Ein I/O-Die versorgt bis zu zwei Compute-Dies mit Daten. (Bild: AMD)
  • Damit die unterschiedlichen Chips auf einen Träger passen, braucht es ein aufwendiges Packaging. (Bild: AMD)
  • Das 12-schichtige Substrat war eine Herausforderung, da drei Dies samt PCIe Gen4 nach außen geführt wird. (Bild: AMD)
  • Blockdiagramm eines Systems mit Ryzen 3000 und X570 (Bild: AMD)
  • Vergleich der Schnittstellen einer Matisse-CPU sowie des X570 und Intels Z390 (Bild: AMD)
  • Bei den Ryzen 3000 ist Fabric-Takt von der DDR4-Frequenz entkopppelt. (Bild: AMD)
  • Überblick eines Zen-2-Kerns (Bild: AMD)
  • Decode-Stufe eines Zen-2-Kerns (Bild: AMD)
  • Gleitkomma-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Integer-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Load/Store-Block eines Zen-2-Kerns (Bild: AMD)
  • Zen 2 unterstützt neue Instruktionen. (Bild: AMD)
  • Die Leistung pro Takt soll 15 Prozent höher liegen. (Bild: AMD)
  • Neben der IPC beschleunigt 7 nm die Frequenz für mehr Geschwindigkeit. (Bild: AMD)
  • Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)
  • Die Corsair MP600 ist eine der ersten PCIe-Gen4-SSDs. (Bild: Marc Sauter/Golem.de)
  • Wie alle anderen Modelle auch basiert sie auf dem E16-Controller von Phison. (Bild: Marc Sauter/Golem.de)
  • Die sequenzielle Lese- und Schreibrate ist extrem hoch, die restlichen Werte kaum besser als bei einer PCIe-Gen3-SSD. (Bild: Golem.de)
  • Der Atto-Benchmark bestätigt die Leistungswerte der Corsair MP600. (Bild: Golem.de)
  • Windows 10 v1903 hat einen verbesserten Scheduler und und unterstützt ein schnelleres Hochtakten. (Bild: AMD)
  • Das steigert die Leistung in einigen Spielen und bei Burst-Workloads wie dem Starten von Apps. (Bild: AMD)
  • Ryzen 9 3900X übertaktet auf 4,35 GHz. (Bild: Golem.de)
  • Precision Boost Overdrive erhöht den Takt automatisch um 200 MHz. (Bild: Golem.de)
Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)

Ein paar Worte zu Sidechannel-Angriffen: Zen 2 hat einen Hardware-Schutz gegen Spectre und Spectre v4 alias Speculative Store Bypass, bei Zen(+) waren hier noch die Firmware und das Betriebssystem gefragt. Sicherheitslücken wie L1TF (L1 Terminal Fault), Meltdown oder Microarchitectural Data Sampling für Attacken wie Zombieload sollen laut AMD bei allen Zen-basierten Prozessoren ohnehin nicht funktionieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 DDR4-3600 dank 12-nm-I/OFirmware und PCIe Gen4 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12.  


Anzeige
Spiele-Angebote
  1. 16,99€
  2. (u. a. eFootball PES 2021 für 7,99€, Assetto Corsa Competizione für 16,99€,
  3. (u. a. Chicken Police für 14,99€, Through the Darkest of Times für 9,99€, Townsmen - A...
  4. 48,99€

David64Bit 09. Jul 2019

Ja - und andererseits bläst die CPU dann die Grafikpipeline sowas von zu, dass nix mehr...

bla 09. Jul 2019

Also mein letztes Board war ein H87 Board von ASROCK und hat mich ~70 Euro gekostet.

Sharra 09. Jul 2019

Quark mit Käse. Was ist mit Raven Ridge? Was ist mit Picasso? Nur weil Intel seine CPUs...

Unix_Linux 09. Jul 2019

es ist vollbracht. ich schreibe gerade von meinem neuen AMD (ryzen 7 3700X) system. also...

Ach 09. Jul 2019

Die 1660Ti ist kleiner, sparsamer und schneller als die RX590 : => gpucheck.com...


Folgen Sie uns
       


Sprachsteuerung mit Apple Music im Vergleich

Eigentlich sollen smarte Lautsprecher den Musikkonsum auf Zuruf besonders bequem machen - aber das gelingt oftmals nicht. Überraschenderweise spielen Siri, Google Assistant und Alexa bei gleichen Sprachbefehlen andere Sachen, obwohl alle auf Apple Music zugreifen.

Sprachsteuerung mit Apple Music im Vergleich Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /