• IT-Karriere:
  • Services:

Zen-3-Architektur erklärt

Bei Matisse besteht das CCD aus zwei CCX (Core Cluster) mit je vier Kernen und je 16 MByte L3. Will ein Core aus CCX #0 mit einem Core aus CCX #1 kommunizieren, muss dafür der Umweg über das I/O-Die bemüht werden. Das kostet Zeit und somit Geschwindigkeit. Bei Vermeer hingegen weist ein CCX nun acht Kerne auf, ein CCX entspricht also dem CCD.

Stellenmarkt
  1. Volksbank Lahr eG, Lahr
  2. operational services GmbH & Co. KG, Nürnberg

Deshalb kann ein CPU-Kern auf bis zu 32 MByte statt bis zu 16 MByte zugreifen und die CCX-zu-CCX-Latenz fällt weg; die eigentliche L3-Latenz steigt allerdings von 39 auf 46 Taktzyklen. Von der geänderten Topologie profitieren vor allem Spiele - wenngleich längst nicht alle - und einige Anwendungen, das zeigte schon der Ryzen 3 3300X (Test). Hinzu kommt, dass AMD die Kerne von Zen 2 auf Zen 3 aktualisiert hat, was der primäre Grund für die gestiegene Performance ist.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)

AMD gibt an, die Leistung pro Takt (IPC) von Zen 3 sei +19 Prozent höher als die von Zen 2, in Spielen sollen es +23 Prozent sein. Diesen Wert hat der Hersteller gemessen, indem 11 Anwendungen und 14 Spiele bei 4 GHz auf 8 Kernen verglichen wurden - konkret ein Ryzen 7 3800XT und ein Ryzen 5 5800X mit DDR4-3600 samt Geforce RTX 2080 Ti. Von Zen+ auf Zen 2 sprach AMD von +15 Prozent IPC (SpecInt_rate_base2006), in Spielen von +19 Prozent.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)

Laut CTO Mark Papermaster handelt es sich bei Zen 3 um keine derivative Entwicklung ausgehend von Zen 2, stattdessen sei es ein Redesign, denn AMD hat zwei parallel arbeitende CPU-Teams. Für Zen 3 wurden daher alle Funktionsblöcke der Kerne angepasst, um die Performance und die Effizienz zu steigern, vom Frontend über das Backend bis hin zu ausgewählten Befehlssatzerweiterungen und einigen Sicherheitsaspekten.

Verglichen mit Zen 2 steigt bei Zen 3 der Durchsatz im Frontend: Die weiterhin Perceptron/TAGE-basierte Sprungvorhersage soll dank geringerer Latenz plus höherer Genauigkeit, dem auf 1.024 Einträge verdoppelten L1 BTB (Branch Target Buffer) und dem um 50 Prozent angewachsenen ITA (Indirect Target Array) schneller sein, der Wechsel zwischen Instruktionen- sowie Op-Cache erfolge flotter und die Puffer an sich haben ein verbessertes Prefetching erhalten. Der Micro-Op-Cache, der Decoder und die Dispatch-Stufe wurden AMD zufolge nicht verändert.

  • Die Ryzen 5000 laufen auf X570/B550/A520 und X470/B450. (Bild: AMD)
  • Notwendig ist ein passendes Firmware-Update mit der richtigen Agesa-Version. (Bild: AMD)
  • Vermeer nutzt erneut ein I/O-Die und ein oder zwei Compute Core Dies. (Bild: AMD)
  • Ein Core Complex [CCX] umfasst nun acht statt vier Kerne. (Bild: AMD)
  • Die Leistung pro Takt soll um 19 Prozent steigen. (Bild: AMD)
  • Verwendete Apps und Spiele, um die IPC zu bestimmen (Bild: AMD)
  • Überblick der Zen-2/3-Architektur (Bild: AMD)
  • Frontend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Sprungvorhersage und Caches wurden überarbeitet. (Bild: AMD)
  • Backend-Verbesserungen bei Zen 3 (Bild: AMD)
  • Die Integer-Einheiten erhalten pro Takt mehr Befehle. (Bild: AMD)
  • An der Anzahl der ALU-Rechenwerke hat sich nichts geändert. (Bild: AMD)
  • Die Latenz der FMA-Einheit ist um einen Takt gesunken. (Bild: AMD)
  • Zen 3 kann drei Load- und zwei Store-Operationen pro Takt durchführen, Zen 2 nur zwei Loads und einen Store. (Bild: AMD)
  • Lade- und Speichervorgänge sind bei Zen 3 flexibler. (Bild: AMD)
  • Der L3-Cache hat 32 MByte pro CCX, dafür aber eine höhere Latenz. (Bild: AMD)
  • Überblick Zen 2 gegen Zen 3 (Bild: AMD)
  • Neue Befehle für Zen 3, etwa für AVX2 (Bild: AMD)
  • Zusätzliche Sicherheitsfunktionen für Zen 3 (Bild: AMD)
Überblick der Zen-2/3-Architektur (Bild: AMD)

Im Backend wurde der Reorder-Buffer zur Berechnungsreihenfolge der Instruktionen von 224 auf 256 Einträge erweitert, dank vier kombinierten Schedulern mit 96 statt 92 Einträgen sowie einem von 180 auf 192 angewachsenen Register File steigt der Durchsatz. Pro Takt werden zehn statt sieben Aufgaben verteilt, wenngleich es bei vier Integer-ALUs und drei AGUs bleibt. Diese wurden jedoch neu kombiniert und um eine dedizierte Sprungeinheit sowie zwei Store-Units erweitert, die alle parallel arbeiten.

Für die 256-Bit-Gleitkomma-Einheiten ist AMD ähnlich vorgegangen und hat die Scheduler von vier auf sechs Aufgaben pro Takt erweitert, zudem wurden zuvor geteilte (shared) ADD- und MUL-Pipelines einzeln verfügbar gemacht; auch das steigert den Durchsatz deutlich. Überdies wurde die Latenz der wichtigen FMA-Einheit um einen Takt auf vier reduziert, was ebenfalls für mehr Geschwindigkeit sorgt. Zen 3 kann außerdem drei Lade- und zwei Speicher-Operationen pro Takt durchführen, Zen 2 schafft nur zwei Loads und einen Store. Ebenfalls wichtig sind die sechs statt vier Table-Walker für schnellere Speicherzugriffen.

Als Instruktionen sind VAES/VPCLMULQD für AVX2 und die Memory Protection Keys (MPK) als Speicherschutz neu. Für mehr Sicherheit soll bei Zen 3 die Control Flow Enforcement Technology (CET) sorgen, sie schützt per Shadow Stack vor ROP-Angriffen, die Code-Fragmente im RAM missbrauchen. Intel nutzt CET seit Tiger Lake im Ultrabook-Segment, hier zusätzlich mit einem Indirect Branch Tracking gegen JOP-basierte Attacken.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Alter Sockel, neue ChipletsDie schnellsten Gaming-CPUs 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Mobile-Angebote
  1. 569€ (Bestpreis!)
  2. (u. a. moto g8 power 64GB 6,4 Zoll Max Vision HD+ für 159,99€)
  3. 214,90€ (Bestpreis!)
  4. (u. a. Apple iPhone 11 Pro Max 256GB 6,5 Zoll Super Retina XDR OLED für 929,98€)

xPandamon 15. Nov 2020 / Themenstart

Ich will sehen wie Intel AMD mit höherem Takt überholt. Die letzte Gen war doch schon...

xPandamon 15. Nov 2020 / Themenstart

Muss man halt mal kurz warten. Intel und Nvidia konnten bei deren Releases noch weniger...

rainer_d 09. Nov 2020 / Themenstart

Ein Haufen Umsatz (50% +x glaube ich sogar) wird mit Cloud Hostern gemacht, die ein paar...

Trollversteher 09. Nov 2020 / Themenstart

Der hatte sogar 12 Threads ;-) Aber das haben die aktuellen Hexacores ja auch. Zumal ja...

Muellersmann 08. Nov 2020 / Themenstart

Es wird immer auf ein Argument mit einem anderen Argument geantwortet, was nicht direkt...

Kommentieren


Folgen Sie uns
       


Panasonic LUMIX DC-S5 im Hands on

Klein in der Hand, voll im Format - wir haben uns die neue Kamera von Panasonic angesehen.

Panasonic LUMIX DC-S5 im Hands on Video aufrufen
Energie- und Verkehrswende: Klimaneutrales Fliegen in weiter Ferne
Energie- und Verkehrswende
Klimaneutrales Fliegen in weiter Ferne

Wasserstoff-Flugzeuge und E-Fuels könnten den Flugverkehr klimafreundlicher machen, sie werden aber gigantische Mengen Strom benötigen.
Eine Recherche von Hanno Böck

  1. Luftfahrt Neuer Flughafen in Berlin ist eröffnet
  2. Luftfahrt Booms Überschallprototyp wird im Oktober enthüllt
  3. Flugzeuge CO2-neutral zu fliegen, reicht nicht

Boothole: Kein Plan, keine Sicherheit
Boothole
Kein Plan, keine Sicherheit

Völlig vorhersehbare Fehler mit UEFI Secure Boot führen vermutlich noch auf Jahre zu Problemen. Vertrauen in die Technik weckt das nicht.
Ein IMHO von Sebastian Grüner


    Pixel 4a 5G im Test: Das alternative Pixel 5 XL
    Pixel 4a 5G im Test
    Das alternative Pixel 5 XL

    2020 gibt es kein Pixel 5 XL - oder etwa doch? Das Pixel 4a 5G ist größer als das Pixel 5, die grundlegende Hardware ist ähnlich bis gleich. Das Smartphone bietet trotz Abstrichen eine Menge.
    Ein Test von Tobias Költzsch

    1. Schnelle Webseiten Google will AMP-Seiten nicht mehr bevorzugen
    2. Digitale-Dienste-Gesetz Will die EU-Kommission doch keine Konzerne zerschlagen?
    3. Google Fotos Kein unbegrenzter Fotospeicher für neue Pixel

      •  /