• IT-Karriere:
  • Services:

Zen-2-Architektur erklärt

Für die Ryzen 3000 verwendet AMD innerhalb der CPU-Chiplets eine verbesserte Technik, denn auf Zen(+) folgt Zen 2. Das grundlegende Konstrukt bleibt gleich: Zwei CCX (Core Complex) mit je vier Kernen bilden gemeinsam mit dem L3-Cache einen Prozessor-Chip. Durch den Shrink von 14/12 nm auf 7 nm konnte AMD die dritte Puffer-Stufe von 8 MByte pro CCX auf 16 MByte verdoppeln, ein achtkerniges Chiplet hat daher satte 32 MByte. Zwar steigt die Latenz des L3-Cache leicht an, die Datenlokalität und der Durchsatz aber werden erhöht. Will ein CCX mit einem CCX kommunizieren, wird das externe I/O-Die statt des internen Fabrics verwendet. Das erhöht zwar die Latenz, vereinfacht aber die Kontrolllogik stark.

Stellenmarkt
  1. Hochschule Esslingen, Esslingen am Neckar
  2. Württembergische Gemeinde-Versicherung a.G., Stuttgart

Im Frontend hat AMD die bekannte Perceptron-basierte Sprungvorhersage verbessert, um Daten in den L1-Instruktionen-Cache zu laden, zusätzlich wurde auch eine Tage-Sprungvorhersage umgesetzt: Das steht für Tagged Geometric History Length und gilt als eine der derzeit fortschrittlichsten Methoden für eine Branch-Prediction. AMD spricht in Kombination mit den massiv vergrößerten Branch-Target-Buffern (BTBs) von einer 30 Prozent verringerten Miss-Rate, was maßgeblich für eine hohe CPU-Geschwindigkeit ist. Andere Designs mit einer Tage-Sprungvorhersage sind unter anderem der Boom 2, ein RISC-V-Kern, und der Xiaomi-Core in Phytiums Mars, ein ARM-Chip.

Der L1-Instruktionen-Cache wurde von AMD von 64 KByte auf 32 KByte halbiert, was im ersten Moment kurios erscheinen mag. Allerdings hat sich die Assoziativität von 4-fach auf 8-fach verdoppelt, was die Hit-Rate im Puffer hoch hält und für eine bessere Taktbarkeit sowie optimierte SMT-Leistung sorgen soll. Vor allem aber schafft der kleinere L1I den Platz, um das Fassungsvermögen des Micro-Op-Cache von 2.048 auf 4.096 Einträge zu erhöhen. Das hilft, die Performance bei niedriger Leistungsaufnahme zu steigern, weil so Instruktionen nicht erst decodiert, sondern wiederverwendet werden können. Intels Micro-Op-Cache hat bisher 1.536 Einträge.

  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • Der Ryzen 9 3900X ist vorerst AMDs Mainstream-Topmodell. (Bild: Marc Sauter/Golem.de)
  • Alle Matisse unterstützen DDR4-3200. (Bild: Martin Wolf/Golem.de)
  • Matisse ist bereits die vierte CPU-Generation für den Sockel AM4. (Bild: AMD)
  • Matisse besteht intern aus mindestens zwei Chips, als 12- oder 16-Kerner aus drei. (Bild: AMD)
  • Ein I/O-Die versorgt bis zu zwei Compute-Dies mit Daten. (Bild: AMD)
  • Damit die unterschiedlichen Chips auf einen Träger passen, braucht es ein aufwendiges Packaging. (Bild: AMD)
  • Das 12-schichtige Substrat war eine Herausforderung, da drei Dies samt PCIe Gen4 nach außen geführt wird. (Bild: AMD)
  • Blockdiagramm eines Systems mit Ryzen 3000 und X570 (Bild: AMD)
  • Vergleich der Schnittstellen einer Matisse-CPU sowie des X570 und Intels Z390 (Bild: AMD)
  • Bei den Ryzen 3000 ist Fabric-Takt von der DDR4-Frequenz entkopppelt. (Bild: AMD)
  • Überblick eines Zen-2-Kerns (Bild: AMD)
  • Decode-Stufe eines Zen-2-Kerns (Bild: AMD)
  • Gleitkomma-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Integer-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Load/Store-Block eines Zen-2-Kerns (Bild: AMD)
  • Zen 2 unterstützt neue Instruktionen. (Bild: AMD)
  • Die Leistung pro Takt soll 15 Prozent höher liegen. (Bild: AMD)
  • Neben der IPC beschleunigt 7 nm die Frequenz für mehr Geschwindigkeit. (Bild: AMD)
  • Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)
  • Die Corsair MP600 ist eine der ersten PCIe-Gen4-SSDs. (Bild: Marc Sauter/Golem.de)
  • Wie alle anderen Modelle auch basiert sie auf dem E16-Controller von Phison. (Bild: Marc Sauter/Golem.de)
  • Die sequenzielle Lese- und Schreibrate ist extrem hoch, die restlichen Werte kaum besser als bei einer PCIe-Gen3-SSD. (Bild: Golem.de)
  • Der Atto-Benchmark bestätigt die Leistungswerte der Corsair MP600. (Bild: Golem.de)
  • Windows 10 v1903 hat einen verbesserten Scheduler und und unterstützt ein schnelleres Hochtakten. (Bild: AMD)
  • Das steigert die Leistung in einigen Spielen und bei Burst-Workloads wie dem Starten von Apps. (Bild: AMD)
  • Ryzen 9 3900X übertaktet auf 4,35 GHz. (Bild: Golem.de)
  • Precision Boost Overdrive erhöht den Takt automatisch um 200 MHz. (Bild: Golem.de)
Überblick eines Zen-2-Kerns (Bild: AMD)

Wie gehabt decodiert auch Zen 2 bis zu vier Instruktionen pro Takt, wobei der Decoder zusammen mit dem Micro-Op-Cache weiterhin bis zu sechs Befehle an die Ausführungseinheiten senden kann. Der Reorder-Buffer zur Berechnungsreihenfolge der Instruktionen wurde von 192 auf 224 Einträge erweitert und versorgt die Integer- sowie die Gleitkomma-Blöcke. Der Integer-Register-File nimmt 180 statt 168 Einträge auf, zudem gibt es nun einen 7-fachen statt 6-fachen Scheduler. Die vier ALUs bleiben erhalten, AMD hat aber eine dritte Adresseinheit (Store-AGU) hinzugefügt, welche die Lade-/Speichereinheiten besser auslastet. Deren Bandbreite hat AMD von 16 KByte auf 32 KByte pro Takt verdoppelt, dahinter sitzt der nun doppelt so schnelle L1-Daten-Cache samt größeren Buffern.

Beim Gleitkomma-Block wurde die Bandbreite ebenfalls verdoppelt, denn die vier SIMD-Einheiten arbeiten nun mit 256 Bit statt mit 128 Bit. Die Pipelines können AVX2-Befehle daher in einem Takt abarbeiten, was sich mit dem synthetischen FPU-Julia-Benchmark von Aida64 schön aufzeigen lässt: Ein Ryzen 7 3700X erreicht fast doppelt so viele FP32-Flops wie ein Ryzen 7 2700X. Von der doppelten AVX2-Geschwindigkeit profitiert primär Software wie Blender und H.265-Encoding, aber auch einige Spiele legen zu. AMD betonte, dass die Latenz für Gleitkomma-Multiplikationen von vier auf drei Takte reduziert wurde.

Alles in allem nennt der Hersteller eine um 15 Prozent verbesserte Leistung pro Takt (IPC) verglichen mit Zen+, also der Architektur der Ryzen 2000 alias Pinnacle Ridge. Dieser Wert schwankt allerdings stark abhängig von der verwendeten Software, zudem hat AMD den Ryzen 3000 abseits schnellerer Kerne auch noch Optimierungen beim Fabric, dem generellen Aufbau mit dem I/O-Die und einen flotteren DDR4-Speicher verpasst.

  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • RTX 2080 Ti, 16GB DDR4, Seasonic TX-1000, Win10 v1903, GF430.86 (Bild: Golem.de)
  • Der Ryzen 9 3900X ist vorerst AMDs Mainstream-Topmodell. (Bild: Marc Sauter/Golem.de)
  • Alle Matisse unterstützen DDR4-3200. (Bild: Martin Wolf/Golem.de)
  • Matisse ist bereits die vierte CPU-Generation für den Sockel AM4. (Bild: AMD)
  • Matisse besteht intern aus mindestens zwei Chips, als 12- oder 16-Kerner aus drei. (Bild: AMD)
  • Ein I/O-Die versorgt bis zu zwei Compute-Dies mit Daten. (Bild: AMD)
  • Damit die unterschiedlichen Chips auf einen Träger passen, braucht es ein aufwendiges Packaging. (Bild: AMD)
  • Das 12-schichtige Substrat war eine Herausforderung, da drei Dies samt PCIe Gen4 nach außen geführt wird. (Bild: AMD)
  • Blockdiagramm eines Systems mit Ryzen 3000 und X570 (Bild: AMD)
  • Vergleich der Schnittstellen einer Matisse-CPU sowie des X570 und Intels Z390 (Bild: AMD)
  • Bei den Ryzen 3000 ist Fabric-Takt von der DDR4-Frequenz entkopppelt. (Bild: AMD)
  • Überblick eines Zen-2-Kerns (Bild: AMD)
  • Decode-Stufe eines Zen-2-Kerns (Bild: AMD)
  • Gleitkomma-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Integer-Einheit eines Zen-2-Kerns (Bild: AMD)
  • Load/Store-Block eines Zen-2-Kerns (Bild: AMD)
  • Zen 2 unterstützt neue Instruktionen. (Bild: AMD)
  • Die Leistung pro Takt soll 15 Prozent höher liegen. (Bild: AMD)
  • Neben der IPC beschleunigt 7 nm die Frequenz für mehr Geschwindigkeit. (Bild: AMD)
  • Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)
  • Die Corsair MP600 ist eine der ersten PCIe-Gen4-SSDs. (Bild: Marc Sauter/Golem.de)
  • Wie alle anderen Modelle auch basiert sie auf dem E16-Controller von Phison. (Bild: Marc Sauter/Golem.de)
  • Die sequenzielle Lese- und Schreibrate ist extrem hoch, die restlichen Werte kaum besser als bei einer PCIe-Gen3-SSD. (Bild: Golem.de)
  • Der Atto-Benchmark bestätigt die Leistungswerte der Corsair MP600. (Bild: Golem.de)
  • Windows 10 v1903 hat einen verbesserten Scheduler und und unterstützt ein schnelleres Hochtakten. (Bild: AMD)
  • Das steigert die Leistung in einigen Spielen und bei Burst-Workloads wie dem Starten von Apps. (Bild: AMD)
  • Ryzen 9 3900X übertaktet auf 4,35 GHz. (Bild: Golem.de)
  • Precision Boost Overdrive erhöht den Takt automatisch um 200 MHz. (Bild: Golem.de)
Die Matisse-CPUs sind weniger anfällig gegen Seitenkanal-Angriffe als Intels Prozessoren. (Bild: AMD)

Ein paar Worte zu Sidechannel-Angriffen: Zen 2 hat einen Hardware-Schutz gegen Spectre und Spectre v4 alias Speculative Store Bypass, bei Zen(+) waren hier noch die Firmware und das Betriebssystem gefragt. Sicherheitslücken wie L1TF (L1 Terminal Fault), Meltdown oder Microarchitectural Data Sampling für Attacken wie Zombieload sollen laut AMD bei allen Zen-basierten Prozessoren ohnehin nicht funktionieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 DDR4-3600 dank 12-nm-I/OFirmware und PCIe Gen4 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12.  


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

David64Bit 09. Jul 2019

Ja - und andererseits bläst die CPU dann die Grafikpipeline sowas von zu, dass nix mehr...

bla 09. Jul 2019

Also mein letztes Board war ein H87 Board von ASROCK und hat mich ~70 Euro gekostet.

Sharra 09. Jul 2019

Quark mit Käse. Was ist mit Raven Ridge? Was ist mit Picasso? Nur weil Intel seine CPUs...

Unix_Linux 09. Jul 2019

es ist vollbracht. ich schreibe gerade von meinem neuen AMD (ryzen 7 3700X) system. also...

Ach 09. Jul 2019

Die 1660Ti ist kleiner, sparsamer und schneller als die RX590 : => gpucheck.com...


Folgen Sie uns
       


Gesichtertausch für Videokonferenzen mit Avatarify - Tutorial

Wir erklären, wie sich das eigene Gesicht durch ein beliebiges animiertes Foto ersetzen lässt.

Gesichtertausch für Videokonferenzen mit Avatarify - Tutorial Video aufrufen
Hildmann, Naidoo, Identitäre: Warum Telegram bei Rechten so beliebt ist
Hildmann, Naidoo, Identitäre
Warum Telegram bei Rechten so beliebt ist

Wer auf Telegram hetzt, den Holocaust leugnet oder Verschwörungsideologien verbreitet, muss nicht befürchten, dass seine Beiträge gelöscht werden. Auch große Gruppen fallen dort nicht unters NetzDG, die Strafverfolgung ist schwierig.
Ein Bericht von Stefan Krempl


    Star Wars Jedi Fallen Order: Die Macht ist mit den physikalisch Animierten
    Star Wars Jedi Fallen Order
    Die Macht ist mit den physikalisch Animierten

    GDC 2020 Das Imperium stirbt korrekt simuliert: Ein Entwickler von Respawn hat das Animationssystem von Jedi Fallen Order vorgestellt.

    1. King Schöne Grafik für 249 Millionen Spieler
    2. John Romero "Haltet euren Quellcode so einfach wie möglich"
    3. Entwicklertagung Entwicklertagung GDC 2020 Summer für August angekündigt

    Elektromobilität: Ein Schiff, angetrieben durch die Kraft der Wellen
    Elektromobilität
    Ein Schiff, angetrieben durch die Kraft der Wellen

    Ein philippinischer Schiffbauer hat ein elektrisch angetriebenes Schiff entworfen, das den Strom für die Maschine selbst erzeugt.

    1. Elektromobilität Neues Elektroschiff für Fahrten durch norwegische Fjorde
    2. Autonomes Schiff IBM testet KI-Kapitän für autonome Mayflower
    3. Induktives Laden Elektrofähre in Norwegen lädt drahtlos

      •  /