Zen+ im Viererpack montiert
Schon bei der ersten Threadripper-Generation hat AMD vier Dies auf ein Package gesetzt, aber nur zwei davon waren tatsächlich funktionsfähig. Jeder Chip weist acht Kerne, zwei Speichercontroller und 32 PCIe-Gen3-Lanes auf. Für den Threadripper 2950X mit 16 Kernen nutzt AMD ergo zwei Dies und zwar die, die diagonal zueinander auf dem Package sitzen. Für den Threadripper 2990WX mit 32 Kernen sind es dann alle vier Chips.
Die Kommunikation zwischen den einzelnen Dies übernimmt das Infinity Fabric, welches auf Serdes-Links basiert. Die nutzen eine 32-Byte-Übertragung, welche mit Speichertakt angetrieben wird. Im Falle der Threadripper v2 und einer offiziellen Frequenz von DDR4-2933 sind das intern 1.466 MHz und somit 46,9 GByte pro Sekunde für die Chip-zu-Chip-Kommunikation bei zwei Dies und ergo noch 23,5 GByte pro Sekunde bei allen vier. Die Latenz zwischen den Chips ist deutlich höher als zwischen den CCX-Blöcken pro Prozessor und innerhalb eines CCX-Quadcores.
Beim Threadripper 2950X sind bei den zwei Chips jeweils beide Speicherkanäle und die 32 PCIe-Gen3-Lanes aktiv, beim Threadripper 2990WX geht AMD genauso vor. Die Alternative wäre gewesen, je nur einen Kanal und je nur 16 Bahnen pro Die zu verwenden, was aber ein anderes Routing im Package notwendig gemacht hätte und daher von AMD nie ernsthaft in Betracht gezogen wurde. Zwei der vier Dies steuern also schlicht ihre Recheneinheiten, aber keine I/O-Funktionen bei.
Das hat den Vorteil einer hohen Core-Performance für Anwendungen, die wenig abhängig von Latenzen oder der Speicherdurchsatzrate sind und ihre Daten vorrangig im CPU-Cache halten können. Müssen aber ständig Informationen über das Infinity Fabric von den beiden Compute-Dies angefordert werden, wirkt sich das negativ auf die Leistung aus. Bei den Epyc-CPUs für Server nutzt AMD hingegen immer beide Speicherkanäle pro Chip, selbst Modelle wie der 7251 mit nur acht Kernen (also vier Dies mit je zwei aktiven Cores) haben daher ein Octachannel-Interface um die erläuterte Limitierung zu umgehen.
Im Test des Threadripper 2990WX zeigte sich, dass der Chip bei einigen Anwendungen von der Datentransferrate gebremst wird: Die Compute-Dies müssen dann auf Daten warten, die überdies per langsamerem Fabric und höherer Latenz statt direkt per Memory-Controller geliefert werden. In solchen Fällen ist der Threadripper 2950X trotz nur 16 Kernen schneller, zumal der CPU-Takt bei diesem Chip ein bisschen höher liegt.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Threadripper 2990WX und 2950X im Test: Viel hilft nicht immer viel | Intel hält zumindest teils mit |
Naja, wenn man auf dem TV spielt mit fake 60hz und 5 Meter weiter weg sitzt. Auf einen...
Und welches Spiel braucht einen so hohen konstanten Datenstrom über Stunden? Im...
Phoronix hat übrigens 394 Sekunden für Blender 2.79a Barbershop gemessen (Ubuntu 18.04...
Aber nicht Werte für alle Benchmarks, bei denen unter Windows Anomalien festgestellt...
Die vielleicht 16 Speicherbänke, die mindestens zur Hälfte besetzt sein müssten, dürften...