Ampere Altra Max: 128-kerniger ARM-Prozessor macht Hyperscaler glücklich
Für Cloud-Computing-Anbieter: Der Altra Max schneidet im Test sehr gut ab - zumindest in Bereichen, für die der ARM-basierte Prozessor ausgelegt ist.
Mit dem Ampere Altra Max alias Mystique hat Ampere Computing die bisher erste und einzige ARM-basierte Server-CPU mit 128 Kernen veröffentlicht. Im Test von Anandtech leistet der Prozessor teils deutlich mehr als sein 80-kerniger Vorgänger, in anderen hingegen ist er sogar langsamer als der reguläre Altra alias Quicksilver.
Auch das Duell mit AMDs 64-kernigen Epyc (Milan) und Intels 40-kernigen Xeon (Ice Lake SP) kann der Altra Max für sich entscheiden, allerdings einzig in auf ihn zugeschnittenen Workloads - anderswo fällt er deutlich zurück. Das überrascht nicht, denn um 128 Kerne unterzubringen, musste Ampere gewisse Kompromisse eingehen.
Der Altra hat 32 MByte SLC (System Level Cache aka L3) für 80 Kerne, der Altra Max hingegen nur 16 MByte SLC für gleich 128 Kerne - pro Core ist die Puffermenge also drastisch gesunken. Sofern vergleichsweise wenige Daten lokal vorgehalten werden müssen und primär Rechenleistung zählt, schlagen die 60 Prozent zusätzlichen Kerne oft voll durch.
Multi hui, Single pfui
In solchen Fällen setzt sich der Altra Max mit 3 GHz (M128-30) vom Altra mit 3,3 GHz (Q80-33) ab und überholt auch AMDs Epyc 7763. In einigen Tests skaliert der M128-30 linear und erreicht einen Vorsprung von 45 Prozent zum Q80-33, was dem theoretischen Abstand entspricht.
Bei den Java-Messungen zeigt sich, dass die sonst übliche Aufteilung des Chips in vier NUMA-Nodes die Leistung drastisch reduziert. Wird er statt im Quadrant- im Mono-Modus angesprochen, ist die Performance hingegen exzellent. Allerdings gibt es Probleme bei der Skalierung des 2-Sockel-Systems, da hier viel weniger Kerne belastet werden als gewünscht.
Sobald ein Workload stark SLC- oder RAM- oder taktlastig ist, kann sich der Altra Max nicht von seinem Vorgänger absetzen oder liefert gar niedrigere Resultate. Das zeigt sich bei der isolierten (und für den Chip irrelevanten) Singlethread-Leistung, aber auch bei der pro-Core/Thread-Performance. In diesem Szenario liegt der M128-30 hinter dem Q80-33 und fällt selbst hinter Intels alte Xeon mit 14-nm-Technik (Cascade Lake SP) zurück.
Cloud/Hyperscaler-Markt ist das Ziel
Wird der Altra Max zum Kompilieren von LLVM eingesetzt, treten Stärken und Schwächen zugleich auf: Das eigentliche Kompilieren ist massiv parallelisiert, die Linking-Phasen hingegen laufen nur auf einem Kern. Solche Workloads sind allerdings nicht das, was Cloud-Anbieter und Hyperscaler primär einsetzen.
Für genau diese Zielgruppe hat Ampere den Altra Max aber entwickelt, weshalb dort der von Anandtech liebevoll "flock of chickens" genannte Ansatz (viele Kleine leisten gemeinsam Großes) durchaus funktioniert. Mit der kommenden Siryn-5-nm-CPU soll eine eigene Mikroarchitektur zum Einsatz kommen, die noch mehr auf den Cloud/Hyperscaler-Markt zugeschnitten sein dürfte.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed









