Front- und Backend erklärt

Mit der Bulldozer-Technik und den darauf basierenden Derivaten namens Piledriver, Steamroller sowie Excavator hatte sich AMD für einen als CMT (Core Multithreading) bezeichnetes Design entschieden: Statt klassischer CPU-Kerne gibt es Module, in denen zwei Integer-Cluster und eine Floating-Point-Einheit sitzen. Erstere sind mit je zwei ALUs und zwei AGLUs gut aufgestellt, letztere mit den beiden 128-Bit-FMACs dagegen nicht. Weitere ursprüngliche Schwächen waren ein geteiltes Frontend sowie ein gemeinsamer L2-Speicher für alle Ausführungseinheiten, ein kleiner L1-Daten-Cache und generell ein langsamer Speichercontroller sowie L3-Puffer.

Stellenmarkt
  1. Full Stack Software Developer (m/f/d)
    Lufthansa Technik AG, Hamburg
  2. Junior IT-Security Engineer SIEM (m/w/d)
    Helios IT Service GmbH, Berlin
Detailsuche

Bei der Zen-Architektur findet sich zwar die ein oder andere Idee aus den Jaguar-Kernen und den Bulldozer-Modulen, die Parallelen zu Intels Designs seit Sandy Bridge sind aber größer. Ungeachtet dessen unterscheidet sich Zen von der Konkurrenz in vielen Punkten: Ein Summit Ridge, so der Codename für die Ryzen-Prozessoren, basiert auf einem Zeppelin genannten Chip, verkauft wird das B1-Stepping. Die CPUs werden im 14LPP-Verfahren bei Globalfoundries gefertigt und damit in einem einigermaßen mit Intels 14FF(+) vergleichbarem Prozess. Das Die misst 213 mm², was AMD aber nicht bestätigen wollte. Interessant ist, dass die CPUs trotz höherer Packdichte aus satten 4,8 Milliarden Transistoren bestehen - Intel schafft es, 15 Kerne und vier statt zwei Speicherkanäle in 4,7 Milliarden Transistoren unterzubringen (MCC-Die der BDW-EP).

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Ryzen besteht aus zwei CCX. (Bild: AMD)

Ein Zeppelin umfasst keine vier Module, sondern zwei CCX (Core Complex) mit jeweils vier Kernen und 8 MByte L3-Cache, die per Data Fabric alias Infinity Fabric miteinander verbunden sind. Einen Teil der technischen Neuerungen der Zen-Technik hatte AMD bereits auf der Hot Chips erläutert, auf der ISSCC und dem Tech Day gab es weitere Informationen: Im Frontend etwa findet sich eine Perceptron-basierte Sprungvorhersage, ein 64 KByte großer L1-Daten-Cache mit sparsamerem Write-Through-Design sowie ein 2.048 Instruktionen fassender Macro-Op-Cache. Generell sind die allermeisten Puffer schneller und tiefer als bei Bulldozer, verglichen mit Intel bewegen sich OoO-Window und Co. zwischen Haswell und Skylake.

Auch beim L1-Instruktionen-Cache (32 KByte) und dem 2 MByte großen, inklusiven L2-Cache pro CCX hat AMD die Geschwindigkeit sowie Latenzen verbessert, was hilft, die dahinterliegenden Rechenwerke mit Daten zu versorgen. Die müssen aber zuvor mithilfe der Lade-/Speichereinheiten durch die Decoder-Stufe, pro Takt sind 2x Load oder 1x Load/Store möglich: Aus dem L1D-Cache heraus kann Zen nur vier statt fünf (Intel) Instruktionen pro Takt decodieren, bei einem Treffer im Op-Cache (kein µOP!) aber sechs an den Dispatcher weiterleiten. Der wiederum schickt bis zu vier Micro-Ops an die Integer- oder bis zu sechs an die Gleitkomma-Pipelines.

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Blockdiagramm eines Zen-Kerns (Bild: AMD)
Golem Akademie
  1. Scrum Product Owner: Vorbereitung auf den PSPO I (Scrum.org): virtueller Zwei-Tage-Workshop
    3.–4. März 2022, virtuell
  2. Netzwerktechnik Kompaktkurs: virtueller Fünf-Tage-Workshop
    6.–10. Dezember 2021, virtuell
Weitere IT-Trainings

Der Integer-Teil ist mit vier Rechenwerken (ALU) und zwei Adresseinheiten (AGU) sehr breit aufgestellt, zwei Branch-Befehle pro Takt wie bei Intel dürften bei SMT zudem hilfreich sein. Die Fließkomma-Einheit besteht aus zwei Multiplikations- (FMUL) und zwei Additions-Pipelines (FADD), die alle relevanten Befehlssatzerweiterungen wie beschleunigtes AES und AVX2 (256 Bit) ohne Zusammenschalten von 128-Bit-FADD-Pipes sowie neuerdings auch SHA1 unterstützen. Das ist für Desktops weniger relevant, dafür umso wichtiger für Server-Systeme.

Gerade für Consumer nicht unerheblich - das Stichwort lautet Spiele - sind der Speichercontroller und die Kommunikation der beiden CCX. An dieser Stelle wird AMD mit Zen 2 vermutlich nachbessern wollen, denn die aktuelle Zen-Ausbaustufe schwächelt hier etwas. Eine Scheduler-Anpassung unter Windows 10 halten wir nicht für nötig, da Threads bereits innerhalb eines CCX gehalten werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Probleme mit dem UEFISchneller L3-Cache, langsamer IMC 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14. 13
  15.  


Demon80 06. Mai 2017

Das pci Express Problem haben aber alle Intel CPU's die es gibt- AMD hat dieses dumme...

Demon80 06. Mai 2017

Nein das lag an den mainboard's wo AMD nichts dagegen machen konnte.

Braineh 11. Mär 2017

Hier wurden schon die ersten RAM-Tests gefahren: http://www.legitreviews.com/ddr4-memory...

Der Held vom... 10. Mär 2017

Oder diplomatischer: Er hat es offenbar anders genutzt als du - oder als ich, was das...

plutoniumsulfat 07. Mär 2017

Einer groben Einteilung genügt das.



Aktuell auf der Startseite von Golem.de
Giga Factory Berlin
Warum Tesla auf über eine Milliarde Euro verzichten musste

Tesla kann die Milliarde Euro Förderung für die Akkufabrik Grünheide nicht beantragen - weil es sonst zu Verzögerungen beim Einsatz neuer Technik käme.

Giga Factory Berlin: Warum Tesla auf über eine Milliarde Euro verzichten musste
Artikel
  1. Nachhaltigkeit: Kawasaki plant E-Motorräder und Wasserstoff-Verbrenner
    Nachhaltigkeit
    Kawasaki plant E-Motorräder und Wasserstoff-Verbrenner

    Kawasaki will elektrische Antriebe für seine Fahrzeuge entwickeln, 2022 sollen drei Elektromotorräder erscheinen.

  2. Doppelbildschirm: Kickstarterprojekt Slide brauchte 6 Jahre bis zum Erfolg
    Doppelbildschirm
    Kickstarterprojekt Slide brauchte 6 Jahre bis zum Erfolg

    Das Kickstarter-Projekt Slidenjoy kann nach 6 Jahren seinen Doppelbildschirm Slide für Notebooks ausliefern.

  3. Elektroauto: Tesla stellt Model Y in China auf AMD-Ryzen um
    Elektroauto
    Tesla stellt Model Y in China auf AMD-Ryzen um

    Tesla hat in China damit begonnen, den Ryzen von AMD in das Model Y zu verbauen. Käufer berichten von einem viel flüssigerem Scrolling.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Black Friday Wochenende • WD Blue SN550 2 TB ab 149€ • LG UltraGear 34GP950G-B 999€ • SanDisk Ultra 3D 500 GB M.2 44€ • Boxsets (u. a. Game of Thrones Blu-ray 79,97€) • Samsung Galaxy S21 128GB 777€ • Premium-Laptops • Cooler Master V850 Platinum 189,90€ • Astro Gaming Headsets [Werbung]
    •  /