Fünf Chiplets auf TR4+
Die älteren HEDT-Modelle wie der 32-kernige Threadripper 2990WX (Test) setzen sich aus vier Dies zusammen: Ein jedes hat acht Kerne und zwei Speicherkanäle, der Sockel TR4 führt aber nur vier Channels nach außen. Zwei der CPU-Chips sind daher reine Compute-Dies und müssen sich Daten über die beiden anderen besorgen. Das hat Nachteile bei Bandbreite und Latenz und zu allem Übel kann der Task-Scheduler unter Windows 10 mit einem solchen Quad-NUMA-Node-Design nicht umgehen.
Für die Threadripper v3, genauso wie bei den Ryzen 3000 und den Epyc 7002, verwendet AMD daher ein zentrales I/O-Die: Darin befinden sich die vier Speichercontroller, weshalb die vier Compute-Cache-Dies alle mit der gleichen Latenz darauf zugreifen und der Windows-Scheduler mit diesem Single-NUMA-Node-Design keine Probleme mehr hat. Alleine durch diesen Kniff ist der Threadripper 3970X teilweise doppelt so schnell wie der Threadripper 2990WX, einfach weil das Betriebssystem keinen Ärger macht.
Unter Windows 10 muss für volle Performance der aktuelle Chipsatztreiber installiert sein, welcher den Ryzen-Balanced-Energiesparplan enthält. Ab v1903 wird damit CPPC2 (Collaborative Power Performance Control 2) verwendet, bei Intel heißt das Speed Shift. Hier übernimmt die CPU selbst die Kontrolle über ihre P-States, statt das Betriebssystem dies steuern zu lassen. Dadurch kann ein Kern viel schneller hohe Taktraten erzielen, was Burst-Workloads hilft. Mit Windows 10 v1909 werden favorisierte CPU-Cores laut Microsoft noch besser angesprochen.
Alle fünf Chiplets auf dem Prozessorträger kommunizieren über das IFOP, das Infinity Fabric On Package. Jedes Compute-Cache-Die liest mit 51,2 GByte/s und schreibt mit 25,6 GByte/s in das I/O-Die. Die überarbeitete Version des Infinity Fabric soll satte 27 Prozent weniger Energie bei gleicher Geschwindigkeit benötigen. Dadurch erhalten die CPU-Kerne mehr Power-Budget und können höher takten, denn der Uncore-Teil machte unter Volllast bisher gut 60 Watt aus. Zudem hat AMD die thermische Verlustleistung für die Threadripper v3 nominell von 250 Watt auf 280 Watt gesteigert.
Neben den CPUs aktualisiert AMD auch die Plattform, weshalb Nutzer einer X399-Platine mit Sockel TR4 (SP3r2) nicht auf die Threadripper v3 umrüsten können. Die neue Fassung wird als sTRX4 alias TR4+ (SP3r3) alias LGA 4096 bezeichnet: Sie ist mechanisch kompatibel, elektrisch aber inkompatibel, denn AMD bindet den Chipsatz anders an. Der ältere X399 hat nur PCIe-Gen3-Lanes und wird mit vier davon mit dem Prozessor verknüpft. Beim TRX40 - er entspricht dem X570 - kommen hingegen PCIe-Gen4-Lanes und gleich acht davon zum Einsatz. Das resultiert in der vierfachen Bandbreite zwischen CPU und Chipsatz.
Die Threadripper v3 selbst integrieren 56 frei verfügbare PCIe-Gen4-Lanes für Grafikkarten und NVMe-SSDs, wie üblich können Mainboardhersteller davon acht auch in Sata-6-GBit/s-Ports umwandeln. Hinzu kommen vier USB 3.2 Gen2, weitere acht stecken im TRX40-Chipsatz. Der hat überdies noch 16 (umwandelbare) PCIe-Gen4-Lanes, vier dedizierte Sata-6-GBit/s- und vier USB-2.0-Ports.
Zusammengerechnet sind das 72 PCIe-Gen4-Lanes bei den Threadripper v3, wohingegen Intels X299-Plattform die gleiche Anzahl bei halber Geschwindigkeit aufweist, davon aber 24 PCIe-Gen3-Lanes am Chipsatz hängen, der wiederum nur per x4-Link mit der CPU kommuniziert. Kommen wir zu den Benchmarks.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Threadripper 3970X/3960X im Test: AMD wird uneinholbar | Intels i9 ist chancenlos |
Windows Hintergrundprozesse. Windows 8/10 hat eine Flut von über 100 zusätzlichwn gebracht.
Wenn es unter Dauerlast mehr als 95W beim 9900K sind, dann liegt es am Mainboard und...
Zudem sind Intels CPU-Designs auch relativ stark mit dem Fertigungsprozess verbandelt...
Der Ringbus hat tatsächlich prinzipbedingt etwas geringere Latenzen als AMDs IF, der das...
Numbercruncher für FEA?