Front- und Backend erklärt

Mit der Bulldozer-Technik und den darauf basierenden Derivaten namens Piledriver, Steamroller sowie Excavator hatte sich AMD für einen als CMT (Core Multithreading) bezeichnetes Design entschieden: Statt klassischer CPU-Kerne gibt es Module, in denen zwei Integer-Cluster und eine Floating-Point-Einheit sitzen. Erstere sind mit je zwei ALUs und zwei AGLUs gut aufgestellt, letztere mit den beiden 128-Bit-FMACs dagegen nicht. Weitere ursprüngliche Schwächen waren ein geteiltes Frontend sowie ein gemeinsamer L2-Speicher für alle Ausführungseinheiten, ein kleiner L1-Daten-Cache und generell ein langsamer Speichercontroller sowie L3-Puffer.

Bei der Zen-Architektur findet sich zwar die ein oder andere Idee aus den Jaguar-Kernen und den Bulldozer-Modulen, die Parallelen zu Intels Designs seit Sandy Bridge sind aber größer. Ungeachtet dessen unterscheidet sich Zen von der Konkurrenz in vielen Punkten: Ein Summit Ridge, so der Codename für die Ryzen-Prozessoren, basiert auf einem Zeppelin genannten Chip, verkauft wird das B1-Stepping. Die CPUs werden im 14LPP-Verfahren bei Globalfoundries gefertigt und damit in einem einigermaßen mit Intels 14FF(+) vergleichbarem Prozess. Das Die misst 213 mm², was AMD aber nicht bestätigen wollte. Interessant ist, dass die CPUs trotz höherer Packdichte aus satten 4,8 Milliarden Transistoren bestehen - Intel schafft es, 15 Kerne und vier statt zwei Speicherkanäle in 4,7 Milliarden Transistoren unterzubringen (MCC-Die der BDW-EP).

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Ryzen besteht aus zwei CCX. (Bild: AMD)

Ein Zeppelin umfasst keine vier Module, sondern zwei CCX (Core Complex) mit jeweils vier Kernen und 8 MByte L3-Cache, die per Data Fabric alias Infinity Fabric miteinander verbunden sind. Einen Teil der technischen Neuerungen der Zen-Technik hatte AMD bereits auf der Hot Chips erläutert, auf der ISSCC und dem Tech Day gab es weitere Informationen: Im Frontend etwa findet sich eine Perceptron-basierte Sprungvorhersage, ein 64 KByte großer L1-Daten-Cache mit sparsamerem Write-Through-Design sowie ein 2.048 Instruktionen fassender Macro-Op-Cache. Generell sind die allermeisten Puffer schneller und tiefer als bei Bulldozer, verglichen mit Intel bewegen sich OoO-Window und Co. zwischen Haswell und Skylake.

Auch beim L1-Instruktionen-Cache (32 KByte) und dem 2 MByte großen, inklusiven L2-Cache pro CCX hat AMD die Geschwindigkeit sowie Latenzen verbessert, was hilft, die dahinterliegenden Rechenwerke mit Daten zu versorgen. Die müssen aber zuvor mithilfe der Lade-/Speichereinheiten durch die Decoder-Stufe, pro Takt sind 2x Load oder 1x Load/Store möglich: Aus dem L1D-Cache heraus kann Zen nur vier statt fünf (Intel) Instruktionen pro Takt decodieren, bei einem Treffer im Op-Cache (kein µOP!) aber sechs an den Dispatcher weiterleiten. Der wiederum schickt bis zu vier Micro-Ops an die Integer- oder bis zu sechs an die Gleitkomma-Pipelines.

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Der Integer-Teil ist mit vier Rechenwerken (ALU) und zwei Adresseinheiten (AGU) sehr breit aufgestellt, zwei Branch-Befehle pro Takt wie bei Intel dürften bei SMT zudem hilfreich sein. Die Fließkomma-Einheit besteht aus zwei Multiplikations- (FMUL) und zwei Additions-Pipelines (FADD), die alle relevanten Befehlssatzerweiterungen wie beschleunigtes AES und AVX2 (256 Bit) ohne Zusammenschalten von 128-Bit-FADD-Pipes sowie neuerdings auch SHA1 unterstützen. Das ist für Desktops weniger relevant, dafür umso wichtiger für Server-Systeme.

Gerade für Consumer nicht unerheblich - das Stichwort lautet Spiele - sind der Speichercontroller und die Kommunikation der beiden CCX. An dieser Stelle wird AMD mit Zen 2 vermutlich nachbessern wollen, denn die aktuelle Zen-Ausbaustufe schwächelt hier etwas. Eine Scheduler-Anpassung unter Windows 10 halten wir nicht für nötig, da Threads bereits innerhalb eines CCX gehalten werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Probleme mit dem UEFISchneller L3-Cache, langsamer IMC 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14. 13
  15.  


Demon80 06. Mai 2017

Das pci Express Problem haben aber alle Intel CPU's die es gibt- AMD hat dieses dumme...

Demon80 06. Mai 2017

Nein das lag an den mainboard's wo AMD nichts dagegen machen konnte.

Braineh 11. Mär 2017

Hier wurden schon die ersten RAM-Tests gefahren: http://www.legitreviews.com/ddr4-memory...

Der Held vom... 10. Mär 2017

Oder diplomatischer: Er hat es offenbar anders genutzt als du - oder als ich, was das...



Aktuell auf der Startseite von Golem.de
Nachfolger von CS GO
Counter-Strike 2 ist geleakt

Eigentlich steht CS 2 bisher nur ausgewählten Personen zur Verfügung. Eine davon hat die Spieldateien aber offenbar ins Internet hochgeladen.

Nachfolger von CS GO: Counter-Strike 2 ist geleakt
Artikel
  1. Model S und Model X: Teslas rundes Lenkrad ist ausverkauft
    Model S und Model X
    Teslas rundes Lenkrad ist ausverkauft

    Tesla kann die Alternative zum Steuerhorn beim Model X und Model S nicht liefern. Offenbar wurde die Nachfrage unterschätzt.

  2. Akkutechnik: Amprius stellt Akkuzellen mit über 500 Wh/kg vor
    Akkutechnik
    Amprius stellt Akkuzellen mit über 500 Wh/kg vor

    Mit viel Aufwand können inzwischen Akkus nah an der Grenze zum physikalisch Machbaren gebaut werden. Was fehlt, ist die Massenproduktion.
    Eine Analyse von Frank Wunderlich-Pfeiffer

  3. Tiktok-Randale bei Creed III: Kinos setzen auf Erhöhung der FSK und Security
    Tiktok-Randale bei Creed III
    Kinos setzen auf Erhöhung der FSK und Security

    Kinos wollen verhindern, dass Zuschauer wegen Störaktionen dem Boxerfilm Creed III fernbleiben. Der Trend, sich beim Randalieren auf Tiktok zu zeigen, hält an.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MediaMarkt-Osterangebote • 3 Spiele kaufen, nur 2 bezahlen • Cyberport Jubiläums-Deals • MindStar: Gigabyte RTX 4080 OC 1.229€ • NBB Black Weeks • Crucial SSD 1TB/2TB (PS5) bis -42% • Amazon Smart TVs ab 189€ • PS5 + RE4 569€ • Nintendo Switch + Spiel + Goodie 288€ [Werbung]
    •  /