Abo
  • IT-Karriere:

Front- und Backend erklärt

Mit der Bulldozer-Technik und den darauf basierenden Derivaten namens Piledriver, Steamroller sowie Excavator hatte sich AMD für einen als CMT (Core Multithreading) bezeichnetes Design entschieden: Statt klassischer CPU-Kerne gibt es Module, in denen zwei Integer-Cluster und eine Floating-Point-Einheit sitzen. Erstere sind mit je zwei ALUs und zwei AGLUs gut aufgestellt, letztere mit den beiden 128-Bit-FMACs dagegen nicht. Weitere ursprüngliche Schwächen waren ein geteiltes Frontend sowie ein gemeinsamer L2-Speicher für alle Ausführungseinheiten, ein kleiner L1-Daten-Cache und generell ein langsamer Speichercontroller sowie L3-Puffer.

Stellenmarkt
  1. Institut Franco-Allemand de Recherches Saint-Louis, Weil am Rhein
  2. Vodafone GmbH, Frankfurt am Main

Bei der Zen-Architektur findet sich zwar die ein oder andere Idee aus den Jaguar-Kernen und den Bulldozer-Modulen, die Parallelen zu Intels Designs seit Sandy Bridge sind aber größer. Ungeachtet dessen unterscheidet sich Zen von der Konkurrenz in vielen Punkten: Ein Summit Ridge, so der Codename für die Ryzen-Prozessoren, basiert auf einem Zeppelin genannten Chip, verkauft wird das B1-Stepping. Die CPUs werden im 14LPP-Verfahren bei Globalfoundries gefertigt und damit in einem einigermaßen mit Intels 14FF(+) vergleichbarem Prozess. Das Die misst 213 mm², was AMD aber nicht bestätigen wollte. Interessant ist, dass die CPUs trotz höherer Packdichte aus satten 4,8 Milliarden Transistoren bestehen - Intel schafft es, 15 Kerne und vier statt zwei Speicherkanäle in 4,7 Milliarden Transistoren unterzubringen (MCC-Die der BDW-EP).

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Ryzen besteht aus zwei CCX. (Bild: AMD)

Ein Zeppelin umfasst keine vier Module, sondern zwei CCX (Core Complex) mit jeweils vier Kernen und 8 MByte L3-Cache, die per Data Fabric alias Infinity Fabric miteinander verbunden sind. Einen Teil der technischen Neuerungen der Zen-Technik hatte AMD bereits auf der Hot Chips erläutert, auf der ISSCC und dem Tech Day gab es weitere Informationen: Im Frontend etwa findet sich eine Perceptron-basierte Sprungvorhersage, ein 64 KByte großer L1-Daten-Cache mit sparsamerem Write-Through-Design sowie ein 2.048 Instruktionen fassender Macro-Op-Cache. Generell sind die allermeisten Puffer schneller und tiefer als bei Bulldozer, verglichen mit Intel bewegen sich OoO-Window und Co. zwischen Haswell und Skylake.

Auch beim L1-Instruktionen-Cache (32 KByte) und dem 2 MByte großen, inklusiven L2-Cache pro CCX hat AMD die Geschwindigkeit sowie Latenzen verbessert, was hilft, die dahinterliegenden Rechenwerke mit Daten zu versorgen. Die müssen aber zuvor mithilfe der Lade-/Speichereinheiten durch die Decoder-Stufe, pro Takt sind 2x Load oder 1x Load/Store möglich: Aus dem L1D-Cache heraus kann Zen nur vier statt fünf (Intel) Instruktionen pro Takt decodieren, bei einem Treffer im Op-Cache (kein µOP!) aber sechs an den Dispatcher weiterleiten. Der wiederum schickt bis zu vier Micro-Ops an die Integer- oder bis zu sechs an die Gleitkomma-Pipelines.

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Blockdiagramm eines Zen-Kerns (Bild: AMD)

Der Integer-Teil ist mit vier Rechenwerken (ALU) und zwei Adresseinheiten (AGU) sehr breit aufgestellt, zwei Branch-Befehle pro Takt wie bei Intel dürften bei SMT zudem hilfreich sein. Die Fließkomma-Einheit besteht aus zwei Multiplikations- (FMUL) und zwei Additions-Pipelines (FADD), die alle relevanten Befehlssatzerweiterungen wie beschleunigtes AES und AVX2 (256 Bit) ohne Zusammenschalten von 128-Bit-FADD-Pipes sowie neuerdings auch SHA1 unterstützen. Das ist für Desktops weniger relevant, dafür umso wichtiger für Server-Systeme.

Gerade für Consumer nicht unerheblich - das Stichwort lautet Spiele - sind der Speichercontroller und die Kommunikation der beiden CCX. An dieser Stelle wird AMD mit Zen 2 vermutlich nachbessern wollen, denn die aktuelle Zen-Ausbaustufe schwächelt hier etwas. Eine Scheduler-Anpassung unter Windows 10 halten wir nicht für nötig, da Threads bereits innerhalb eines CCX gehalten werden.

 Probleme mit dem UEFISchneller L3-Cache, langsamer IMC 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14. 13
  15.  


Anzeige
Spiele-Angebote
  1. 0,49€
  2. 2,22€
  3. 0,00€
  4. 3,99€ statt 19,99€

Demon80 06. Mai 2017

Das pci Express Problem haben aber alle Intel CPU's die es gibt- AMD hat dieses dumme...

Demon80 06. Mai 2017

Nein das lag an den mainboard's wo AMD nichts dagegen machen konnte.

Braineh 11. Mär 2017

Hier wurden schon die ersten RAM-Tests gefahren: http://www.legitreviews.com/ddr4-memory...

Der Held vom... 10. Mär 2017

Oder diplomatischer: Er hat es offenbar anders genutzt als du - oder als ich, was das...

plutoniumsulfat 07. Mär 2017

Einer groben Einteilung genügt das.


Folgen Sie uns
       


Cowboy Pedelec ausprobiert

Sportlich und minimalistisch - das Cowboy Pedelec ist jetzt auch in Deutschland verfügbar.

Cowboy Pedelec ausprobiert Video aufrufen
Zulassung autonomer Autos: Der Mensch fährt besser als gedacht
Zulassung autonomer Autos
Der Mensch fährt besser als gedacht

Mehrere Jahre haben Wissenschaftler und Autokonzerne an Testverfahren für einen Autobahnpiloten geforscht. Die Ergebnisse sprechen für den umfangreichen Einsatz von Simulation. Und gegen den schnellen Einsatz der Technik.
Von Friedhelm Greis

  1. Autonomes Fahren US-Post testet Überlandfahrten ohne Fahrer
  2. Mercedes-Sicherheitsstudie Wenn das Warndreieck autonom aus dem Auto fährt
  3. Einride T-Pod Autonomer Lkw fährt in Schweden Waren aus

Kontist, N26, Holvi: Neue Banking-Apps machen gute Angebote für Freelancer
Kontist, N26, Holvi
Neue Banking-Apps machen gute Angebote für Freelancer

Ein mobiles und dazu noch kostenloses Geschäftskonto für Freiberufler versprechen Startups wie Kontist, N26 oder Holvi. Doch sind die Newcomer eine Alternative zu den Freelancer-Konten der großen Filialbanken? Ja, sind sie - mit einer kleinen Einschränkung.
Von Björn König


    LTE-V2X vs. WLAN 802.11p: Wer hat Recht im Streit ums Auto-WLAN?
    LTE-V2X vs. WLAN 802.11p
    Wer hat Recht im Streit ums Auto-WLAN?

    Trotz langjähriger Verhandlungen haben die EU-Mitgliedstaaten die Pläne für ein vernetztes Fahren auf EU-Ebene vorläufig gestoppt. Golem.de hat nachgefragt, ob LTE-V2X bei direkter Kommunikation wirklich besser und billiger als WLAN sei.
    Eine Analyse von Friedhelm Greis

    1. Vernetztes Fahren Lobbyschlacht um WLAN und 5G in Europa
    2. Gefahrenwarnungen EU setzt bei vernetztem Fahren weiter auf WLAN

      •  /