Chiplets for the Win
Für die Ryzen 3000 (Test) mit bis zu 12 Kernen und später dem 16-kernigen Ryzen 9 3950X (Test) wechselte AMD auf ein dediziertes Chiplet-Design: Das I/O-Die mit DDR4-Speichercontroller, erstmals PCIe-Gen4-Lanes sowie Sata und USB entstand im 12LP-Verfahren, Compute-Die mit den eigenen Kernen im feineren N7-Prozess. So konnte AMD den L3-Cache auf 32 MByte verdoppeln, die eigentlichen Core verbreitern und die Performance signifikant steigern.
So weist die Zen-2-Architektur im Frontend zusätzlich zur Perceptron-basierten eine sehr fortschrittliche Tage-Sprungvorhersage (Tagged Geometric History Length) auf. Der L1-Instruktionen-Cache wurde halbiert, der Micro-Op-Cache dafür verdoppelt. Im Backend hat AMD eine dritte Adresseinheit (Store-AGU) hinzugefügt und beim Gleitkomma-Block wurde die Bandbreite verdoppelt, denn die vier SIMD-Einheiten arbeiten mit 256 Bit statt mit 128 Bit. Die Pipelines können somit AVX2-Befehle in einem Takt abarbeiten, was gerade im Serversegment wichtig ist.
Folgerichtig waren die Ryzen 3000 in Spielen kaum langsamer als ihre Intel-Pendants und in Anwendungen oft weit überlegen. Für die Threadripper 3000 (Test) legt AMD erst 32 Kerne und dann sogar 64 Kerne auf, weshalb der Threadripper 3990X (Test) bis heute uneinholbar ist. Das gilt in allerhand Workloads auch für die Epyc 7002 (Rome), weshalb AMD in den vergangenen Monaten den Umsatz bei Server-CPUs kräftig steigern konnte.
Derweil ging intern die Entwicklung weiter: Das zweite Team bei AMD - so wie ARM und Intel übrigens auch welche haben - hat mit Zen 3 laut Hersteller den bisher größten Fortschritt erzielt. AMD gibt an, die Leistung pro Takt (IPC) von Zen 3 sei +19 Prozent höher als die von Zen 2, in Spielen sollen es +23 Prozent sein. Möglich wurde dies, weil das I/O-Die das gleiche ist wie bisher und einzig das Compute-Die verbessert wurde.
So hat AMD die beiden vierkernigen CCX zu einem gemeinsamen verschmolzen, was zwar den L3-Cache etwa langsamer macht, einem Kern alleine stehen aber bis zu 32 MByte statt 16 MByte zur Verfügung. Vor allem aber muss für die CCX-zu-CCX-Kommunikation nicht mehr das I/O-Die bemüht werden, weil ein CCX nun aus acht gleichberechtigten Kernen besteht. Die eigentlichen Cores hat AMD entsprechend der IPC massiv aufgebohrt.
Im Frontend gibt es allerhand Optimierungen, Gleiches gilt für das Backend. Die vier Integer-ALUs und drei AGUs wurden neu kombiniert und um Einheiten erweitert, die alle parallel arbeiten. Für die 256-Bit-Gleitkomma-Einheiten hat AMD die Scheduler von vier auf sechs Aufgaben pro Takt erhöht, zudem wurden zuvor geteilte (shared) Pipelines einzeln verfügbar gemacht.
Als Resultat sind die Ryzen 5000 (Test) die derzeit schnellsten CPUs für Anwendungen und Spiele. Uns hat daher interessiert, wie die Performance von Zen 1 bis Zen 3 gestiegen ist - und damit weiter mit den Benchmarks.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Initial erfolgreich | Von Keller zur Skyline |
Excel 365 Vorlage ;-)
Bei der Videobearbeitung kommt es auf die Software und die Art an wie du das Video...
Ich würde dieses nicht mehr ganz aktuelle(2018) Video vorschlagen. Da werden einerseits...
AMD war in den letzten Jahren nicht gerade untätig und zu Zeiten von Bulldozer zwar wegen...
Mit SMT4 (für Zen4 geplant) kann Intel dann endgültig einpacken.
Kommentieren