Abo
  • Services:
Anzeige
Ryzen 7 1800X
Ryzen 7 1800X (Bild: Martin Wolf/Golem.de)

Schneller L3-Cache, langsamer IMC

Eine der größten Unbekannten von Zen und Ryzen war in den vergangenen Monaten der Uncore-Bereich. Zwar hatte AMD sich zur Größe und Partitionierung des L3-Caches geäußert und den Speichercontroller grob umrissen, ansonsten aber keine tiefergehenden Informationen kundgetan. Bei den Bulldozer-Architekturen war der Uncore bis einschließlich der letzten Ausbaustufe (Excavator) eine Schwachstelle, denn anders als das Frontend oder die L1-Caches vernachlässigte AMD diesen. Bei Intel hingegen war der Uncore-Umbau von Nehalem zu Sandy Bridge so radikal, dass hier einer der Hauptgründe zu suchen ist, warum vor allem Spiele besser liefen.

Anzeige

Seit Sandy Bridge ist der Uncore (L3-Cache, Ringbus, Speichercontroller) weitestgehend an die Kernfrequenz gekoppelt: Bis einschließlich Ivy Bridge gehören Kerne, L3-Cache und Ringbus zu einer gemeinsamen Domäne, seit Haswell sind Kerne und L3 vom Ring entkoppelt, takten aber gleich hoch, und seit Skylake läuft der Uncore bei den schnellsten Chips ein paar hundert MHz langsamer als die Kerne. Ein Core i7-7700K etwa fährt 4,2 GHz Core und 3,9 GHz Uncore. Anders bei einem FX-8350: Dessen Module takten zwar mit 4 GHz aufwärts, der L3-Cache und Speichercontroller aber mit niedrigen 2,2 GHz.

  • Ryzen 7 1800X (Foto: Martin Wolf/Golem.de)
  • Unsere Testplattform mit MSIs X370 Xpower Gaming Titanium und Noctua NH-U14S (Foto: Martin Wolf/Golem.de)
  • Ryzen unterstützt DDR4-2667 im Dualchannel. (Foto: Martin Wolf/Golem.de)
  • Ein M.2-Slot mit 4x PCIe Gen3 ist beim Sockel AM4 quasi Standard. (Foto: Martin Wolf/Golem.de)
  • Auch USB 3.1 Gen2, hier mit Type C, gehört bei vielen Boards dazu. (Foto: Martin Wolf/Golem.de)
  • Das X steht für einen höheren XFR-Takt. (Bild: AMD)
  • Modellbezeichnung aufgeschlüsselt (Bild: AMD)
  • Überblick zu den Chipsätzen (Bild: AMD)
  • DDR4-2667 gibt's offiziell nur mit Single-Rank-Speicher. (Bild: AMD)
  • Drei neue CPU-Kühler für die Ryzen-Serie (Bild: AMD)
  • Ryzen besteht aus zwei CCX. (Bild: AMD)
  • Die-Shot von Zeppelin (Bild: AMD)
  • Blockdiagramm eines Zen-Kerns (Bild: AMD)
  • Die-Shot eines Zen-Kerns (Bild: AMD)
  • Überblick zu technischen Details (Bild: AMD)
  • Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)
  • XFR ist ein erweiterter Singlecore-Boost. (Bild: AMD)
  • Dank SMT kann Ryzen zwei Threads pro Kern abarbeiten. (Bild: AMD)
  • AMD packt dichter als Intel. (Bild: AMD)
  • Viele Sensoren helfen, Takt und Leistungsaufnahme zu steuern. (Bild: AMD)
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
  • Seasonic Platinum Fanless 520W, 2x 8 oder 4x 2 GByte DDR3-1866/DDR4-2400/26667, Geforce GTX 1080 FE; Win10 x64
Der L3-Cache läuft endlich mit Kerntakt. (Bild: AMD)

Bei der Zen-Mikroarchitektur hat sich AMD für einen anderen Weg entschieden: Der L3-Cache jedes CCX weist die gleiche Frequenz auf wie dessen schnellster Kern - praktisch sollten beim 1800X also mindestens 3,7 GHz anliegen. Wir haben die Datentransferrate mit mehreren Tools vermessen und erreichen Werte, die signifikant besser sind als bei den FX-Modellen. Sie liegen teils über und teils unter denen eines Core i7-6900K: Die Bandbreite und vor allem die Latenz ist stark davon abhängig, wie der Cache angesprochen wird. AMD liefert zwar interne Werte, der Hersteller schlüsselt sie aber nicht auf - die Resultate scheinen wenig schmeichelhaft zu sein. Die Subtimings sind bei Ryzen übrigens nicht justierbar, die Command Rate steht auf 1T.

Im Gespräch mit AMD kristallisierte sich heraus, dass die 16 MByte an L3-Cache nach Möglichkeit nicht als einheitlich angesprochen werden sollten, sondern als zwei 8 MByte fassende Blöcke. Der Puffer ist 16-fach assoziativ und arbeitet weitestgehend exklusiv als Victim-Cache für den L2, er nimmt also vor allem verworfene Cache-Lines auf. Bei Intel ist der L3 inklusive, er enthält also alle L1- und L2-Daten, was es ermöglicht, Kerne schneller abzuschalten. Der L3-Cache von Zen ist dichter gepackt als bei der Konkurrenz und in vier Blöcke unterteilt, die einzeln von der Stromzufuhr getrennt werden können. Jeder Kern eines CCX hat die gleiche Latenz bei einem L3-Zugriff.

CCX zu CCX bremst leicht

Während der L3-Cache mit Kernfrequenz betrieben wird, taktet AMD den Speichercontroller (IMC, Integrated Memory Controller) viel niedriger: Er läuft mit der Geschwindigkeit des eingesetzten Speichers, bei dem offiziell unterstützten DDR4-2667 sind das also gerade einmal 1,33 GHz. AMD selbst legt übrigens nur Latenzen für die Caches vor, und verschweigt die für den RAM. Das wirft Fragen auf, zumal der Hersteller darauf verweist, dass die üblichen Tools angeblich falsche Werte ausgeben sollen.

Die Kommunikation zwischen den beiden L3-Blöcken erfolgt bei Zen ebenfalls mit Speichertakt (32 Byte bidirektional pro Zyklus, ergo 42 GByte pro Sekunde bei DDR4-2667). Das könnte den Chip etwas bremsen - denkbar sind aber auch hohe Latenzen zwischen den Clustern. Wir haben daher die beiden CCX per UEFI-Einstellung umkonfiguriert: Einmal als 4+0-Variante, also einen Quadcore mit 8 MByte bestehend aus nur einem aktiven CCX, und einmal als 2+2, also zwei Kerne pro CCX und insgesamt 16 MByte. Die Leistung in Anwendungen und Spielen unterscheidet sich leicht, in der Spitze ist Ashes of the Singulary mit der 4+0-Konfiguration rund 9 Prozent schneller.

Da Ryzen bei realem Packen mit 7-Zip und in allen Spielen hinter einen ansonsten gleich schnellen Core i7-6900K zurückfällt, könnte der mit geringem Takt arbeitende Speichercontroller der Grund dafür sein. Zwei Ideen von Ryzen, SMT und XFR, sind bisher zumindest für uns nicht einzeln testbar - wir erläutern aber ihre Funktionsweise.

 Front- und Backend erklärtSo funktionieren SMT und XFR 

eye home zur Startseite
Braineh 11. Mär 2017

Hier wurden schon die ersten RAM-Tests gefahren: http://www.legitreviews.com/ddr4-memory...

Themenstart

Der Held vom... 10. Mär 2017

Oder diplomatischer: Er hat es offenbar anders genutzt als du - oder als ich, was das...

Themenstart

plutoniumsulfat 07. Mär 2017

Einer groben Einteilung genügt das.

Themenstart

Dwalinn 07. Mär 2017

Also wenn der Kunde eh alle 4-5 Jahre einen neuen CPU kauft egal ob der jetzt 5% oder 50...

Themenstart

ve2000 07. Mär 2017

Die Kompatibilität würde mich auch interessieren. Ich habe hier ein Gerät mit einem...

Themenstart

Kommentieren



Anzeige

Stellenmarkt
  1. ORBIT Gesellschaft für Applikations- und Informationssysteme mbH, Bonn, Darmstadt
  2. Sparda-Datenverarbeitung eG, Nürnberg
  3. BVV Versicherungsverein des Bankgewerbes a.G., Berlin
  4. IFS Deutschland GmbH & Co. KG, Erlangen


Anzeige
Blu-ray-Angebote
  1. 65,00€
  2. 16,99€ (ohne Prime bzw. unter 29€ Einkauf zzgl. 3€ Versand)
  3. 23,99€ (Vorbesteller-Preisgarantie)

Folgen Sie uns
       


  1. Lufthansa

    Hyperloop könnte innerdeutsche Flüge ersetzen

  2. Blitzkrieg 3

    Neuronale-Netzwerke-KI für Echtzeit-Strategiespiel verfügbar

  3. Mobilfunk

    Fonic Smart S erhält mehr Datenvolumen

  4. Gesetzesentwurf

    Ein Etikettenschwindel bremst das automatisierte Fahren aus

  5. Triby Family

    Portabler Lautsprecher mit E-Paper-Display wird Alexa-fähig

  6. Range Extender

    Mazda plant Elektroauto mit Wankelmotor

  7. Autonomes Fahren

    Uber stoppt nach Unfall Versuch mit selbstfahrenden Taxis

  8. Elektroauto

    Tesla Model 3 soll weiter kommen als der Ampera-E

  9. Blizzard

    Starcraft Remastered erscheint im Sommer 2017

  10. Atom-Unfall

    WD erweitert Support für NAS mit Intels fehlerhaftem Atom



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Videostreaming im Zug: Maxdome umwirbt Bahnfahrer bei Tempo 230
Videostreaming im Zug
Maxdome umwirbt Bahnfahrer bei Tempo 230
  1. Hollywood Filmstudios wollen Filme kurz nach Kinostart streamen
  2. USA Google will Kabelfernsehen über Youtube streamen
  3. Verband DVD-Verleih in Deutschland geht wegen Netflix zurück

Buch - Apple intern: "Die behandeln uns wie Sklaven"
Buch - Apple intern
"Die behandeln uns wie Sklaven"
  1. Übernahme Apple kauft iOS-Automatisierungs-Tool Workflow
  2. Instandsetzung Apple macht iPhone-Reparaturen teurer
  3. Earbuds mit Sensor Apple beantragt Patent auf biometrische Kopfhörer

Lithium-Akkus: Durchbruch verzweifelt gesucht
Lithium-Akkus
Durchbruch verzweifelt gesucht
  1. Super MCharge Smartphone-Akku in 20 Minuten voll geladen
  2. Brandgefahr HP ruft über 100.000 Notebook-Akkus zurück
  3. Brandgefahr Akku mit eingebautem Feuerlöscher

  1. Re: Wenn schon remastered, dann bitte Command and...

    |=H | 10:27

  2. Re: Mehrverbrauch ca 50%

    Klausens | 10:24

  3. Re: Hoffentlich stimmt der Preis

    wasabi | 10:24

  4. Re: irgendwie werde ich das Gefühl nicht los...

    onkel hotte | 10:24

  5. Re: Jetzt mal halblang!

    JohnZ | 10:24


  1. 10:43

  2. 10:28

  3. 09:47

  4. 09:03

  5. 08:42

  6. 07:50

  7. 07:36

  8. 07:14


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel