Zen-3-Architektur erklärt

Bei Matisse besteht das CCD aus zwei CCX (Core Cluster) mit je vier Kernen und je 16 MByte L3. Will ein Core aus CCX #0 mit einem Core aus CCX #1 kommunizieren, muss dafür der Umweg über das I/O-Die bemüht werden. Das kostet Zeit und somit Geschwindigkeit. Bei Vermeer hingegen weist ein CCX nun acht Kerne auf, ein CCX entspricht also dem CCD.

Stellenmarkt
  1. Softwareentwickler Frontend (m/w/d)
    eLearning Manufaktur GmbH, Düsseldorf, Kleve
  2. SAP Consultant - SAP CRM/SAP SD, PP, PS (w/m/d)
    SEW-EURODRIVE GmbH & Co KG, Bruchsal
Detailsuche

Deshalb kann ein CPU-Kern auf bis zu 32 MByte statt bis zu 16 MByte zugreifen und die CCX-zu-CCX-Latenz fällt weg; die eigentliche L3-Latenz steigt allerdings von 39 auf 46 Taktzyklen. Von der geänderten Topologie profitieren vor allem Spiele - wenngleich längst nicht alle - und einige Anwendungen, das zeigte schon der Ryzen 3 3300X (Test). Hinzu kommt, dass AMD die Kerne von Zen 2 auf Zen 3 aktualisiert hat, was der primäre Grund für die gestiegene Performance ist.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)

AMD gibt an, die Leistung pro Takt (IPC) von Zen 3 sei +19 Prozent höher als die von Zen 2, in Spielen sollen es +23 Prozent sein. Diesen Wert hat der Hersteller gemessen, indem 11 Anwendungen und 14 Spiele bei 4 GHz auf 8 Kernen verglichen wurden - konkret ein Ryzen 7 3800XT und ein Ryzen 5 5800X mit DDR4-3600 samt Geforce RTX 2080 Ti. Von Zen+ auf Zen 2 sprach AMD von +15 Prozent IPC (SpecInt_rate_base2006), in Spielen von +19 Prozent.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)

Laut CTO Mark Papermaster handelt es sich bei Zen 3 um keine derivative Entwicklung ausgehend von Zen 2, stattdessen sei es ein Redesign, denn AMD hat zwei parallel arbeitende CPU-Teams. Für Zen 3 wurden daher alle Funktionsblöcke der Kerne angepasst, um die Performance und die Effizienz zu steigern, vom Frontend über das Backend bis hin zu ausgewählten Befehlssatzerweiterungen und einigen Sicherheitsaspekten.

Verglichen mit Zen 2 steigt bei Zen 3 der Durchsatz im Frontend: Die weiterhin Perceptron/TAGE-basierte Sprungvorhersage soll dank geringerer Latenz plus höherer Genauigkeit, dem auf 1.024 Einträge verdoppelten L1 BTB (Branch Target Buffer) und dem um 50 Prozent angewachsenen ITA (Indirect Target Array) schneller sein, der Wechsel zwischen Instruktionen- sowie Op-Cache erfolge flotter und die Puffer an sich haben ein verbessertes Prefetching erhalten. Der Micro-Op-Cache, der Decoder und die Dispatch-Stufe wurden AMD zufolge nicht verändert.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Überblick der Zen-2/3-Architektur (Bild: AMD)

Im Backend wurde der Reorder-Buffer zur Berechnungsreihenfolge der Instruktionen von 224 auf 256 Einträge erweitert, dank vier kombinierten Schedulern mit 96 statt 92 Einträgen sowie einem von 180 auf 192 angewachsenen Register File steigt der Durchsatz. Pro Takt werden zehn statt sieben Aufgaben verteilt, wenngleich es bei vier Integer-ALUs und drei AGUs bleibt. Diese wurden jedoch neu kombiniert und um eine dedizierte Sprungeinheit sowie zwei Store-Units erweitert, die alle parallel arbeiten.

Für die 256-Bit-Gleitkomma-Einheiten ist AMD ähnlich vorgegangen und hat die Scheduler von vier auf sechs Aufgaben pro Takt erweitert, zudem wurden zuvor geteilte (shared) ADD- und MUL-Pipelines einzeln verfügbar gemacht; auch das steigert den Durchsatz deutlich. Überdies wurde die Latenz der wichtigen FMA-Einheit um einen Takt auf vier reduziert, was ebenfalls für mehr Geschwindigkeit sorgt. Zen 3 kann außerdem drei Lade- und zwei Speicher-Operationen pro Takt durchführen, Zen 2 schafft nur zwei Loads und einen Store. Ebenfalls wichtig sind die sechs statt vier Table-Walker für schnellere Speicherzugriffen.

Als Instruktionen sind VAES/VPCLMULQD für AVX2 und die Memory Protection Keys (MPK) als Speicherschutz neu. Für mehr Sicherheit soll bei Zen 3 die Control Flow Enforcement Technology (CET) sorgen, sie schützt per Shadow Stack vor ROP-Angriffen, die Code-Fragmente im RAM missbrauchen. Intel nutzt CET seit Tiger Lake im Ultrabook-Segment, hier zusätzlich mit einem Indirect Branch Tracking gegen JOP-basierte Attacken.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Alter Sockel, neue ChipletsDie schnellsten Gaming-CPUs 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Aktuell auf der Startseite von Golem.de
Anti-Virus
John McAfee tot im Gefängnis aufgefunden

John McAfee ist tot in einer Gefängniszelle gefunden worden. Ihm drohte eine Auslieferung von Spanien in die USA.

Anti-Virus: John McAfee tot im Gefängnis aufgefunden
Artikel
  1. Neue EU-Standardvertragsklauseln: Datentransfer in die USA bleibt riskant
    Neue EU-Standardvertragsklauseln
    Datentransfer in die USA bleibt riskant

    Die neuen EU-Standardsvertragsklauseln sollen den Datentransfer in die USA legitimieren. Doch das Grundproblem mit drei Buchstaben bleibt ungelöst.
    Von Christiane Schulzki-Haddouti

  2. Apple aktualisiert Tags: Neue Firmware-Version für Airtags
    Apple aktualisiert Tags
    Neue Firmware-Version für Airtags

    Apple hat eine neue Version der Airtags-Firmware vorgestellt. Offenbar sind die Anti-Stalking-Funktionen noch verbesserungswürdig gewesen.

  3. Verbraucherzentrale zu Glasfaser: 100 bis 300 MBit/s sind vollkommen ausreichend
    Verbraucherzentrale zu Glasfaser
    "100 bis 300 MBit/s sind vollkommen ausreichend"

    Während alle versuchen, den Glasfaser-Ausbau zu beschleunigen, raten Verbraucherschützer, nicht für Tarife mit sehr hoher Bandbreite zu zahlen, die man angeblich gar nicht benötige.

xPandamon 15. Nov 2020

Ich will sehen wie Intel AMD mit höherem Takt überholt. Die letzte Gen war doch schon...

xPandamon 15. Nov 2020

Muss man halt mal kurz warten. Intel und Nvidia konnten bei deren Releases noch weniger...

rainer_d 09. Nov 2020

Ein Haufen Umsatz (50% +x glaube ich sogar) wird mit Cloud Hostern gemacht, die ein paar...

Trollversteher 09. Nov 2020

Der hatte sogar 12 Threads ;-) Aber das haben die aktuellen Hexacores ja auch. Zumal ja...

Muellersmann 08. Nov 2020

Es wird immer auf ein Argument mit einem anderen Argument geantwortet, was nicht direkt...


Folgen Sie uns
       


  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Dualsense Midnight Black + Ratchet & Clank Rift Apart 87,61€ • 6 Blu-rays für 30€ • Landwirtschafts-Simulator 22 jetzt vorbestellbar ab 39,99€ • MSI Optix MAG272CQR Curved WQHD 165Hz 309€ [Werbung]
    •  /