Neoverse V2: ARMs Server-Design soll alle x86-CPUs schlagen
Mehr Leistung pro Sockel und Thread: Mit Neoverse V2 arbeitet ARM samt Partner an sehr leistungsstarken Cloud-Chiplet-Prozessoren.
ARM hat Neoverse V2 alias Demeter vorgestellt, ein neues Server-CPU-Design. Neoverse V2 folgt auf Neoverse V1 (Zeus) und ist für Cloudanbieter gedacht. Die Prozessoren sollen also von Hyperscalern wie AWS oder für HPC-Bereiche eingesetzt werden. ARM verspricht eine Leistung, die deutlich über von AMDs und Intels x86-Modellen liegen soll.
Die CPU-Kerne von Neoverse V2 basieren auf der aktuellen ARMv9-Architektur, bei Neoverse V1 ist es noch die ARMv8.4-Technik. Dank der SVE2-Befehlssatzerweiterung (Scalable Vector Extension v2) können vier 128-Bit-Vektoren verarbeitet werden, grundsätzlich sind bis zu 2.048 Bit möglich. Ebenfalls neu sind BF16 und INT8, um Berechnungen für künstliche Intelligenz zu beschleunigen.
Wichtig sind auch die asymmetrische MTE (Memory Tagging Extension), um das Ausnutzen von Speicherfehlern, und der erweiterte PAN (Privileged Access Never), um per JIT-Code gestartete Angriffe auf User-Daten wie Passwörter zu verhindern. Hinzu kommt PAC (Pointer Authentication Code), um das Erraten von Schlüsseln zu erschweren. Alle drei Sicherheitsfunktionen wurden mit ARMv9 eingeführt.
Nvidia Grace als erste Implementierung
Für generell mehr Performance verglichen mit Neoverse V1 sorgt der auf bis zu 2 MByte verdoppelte L2-Cache pro Kern. Der System Level Cache (SLC) fällt dank des verbesserten CMN-700 (Coherent Mesh Network) bis zu 512 MByte groß aus. Das Design unterstützt DDR5 und LPDDR5, zudem PCIe Gen5 samt dem darauf basierenden CXL 2.0, um Beschleuniger oder Speichererweiterungen anzubinden.
Neoverse V2 ist für UCIe (Universal Chiplet Interconnect Express) ausgelegt, auch über ARMs eigenes CHI-Fabric (Coherent Hub Interface) können mehrere Chiplets verbunden werden. AWS' Graviton3 war hier der Vorreiter, das Design besteht aus sieben Dies. Auch bei Nvidia Grace werden mehrere Chips gekoppelt, wenn auch nur zwei.
Dieses 4-nm-Design ist das erste, das auf Neoverse V2 basiert: Grace hat 144 Kerne, dazu gleich 32 LPDDR5-Controller für 546 GByte/s. Nvidia zufolge erreicht die CPU einen Spec-Rate2017-Int-Score von 740, was weit über dem 128-kernigen Alibaba Yitian 710 mit 510 liegen würde; dieser ist der momentan stärkste ARM-Prozessor.
Vor AMD und Intel
So überrascht es wenig, dass ARM angibt, dass Neoverse-V2-Implementierungen traditionelle x86-Implementierungen von AMD und Intel zumindest bei der Integer-Performance pro Thread sowie Sockel schlagen sollen. AMD wird demnächst die 96-kernigen Epyc v5 (Genoa) ankündigen, Intels bis zu 60-kernige Sapphire Rapids folgen einige Monate später. Für 2023 hat AMD allerdings Bergamo mit 128 sogenannten Zen4c-Kernen geplant, dieses Design ist als Konter zu ARM Neoverse gedacht. Intel hat mit Sierra Forest ebenfalls einen solchen Prozessor nur mit E/Little-Cores in Arbeit.
Neben Neoverse V2 hat ARM noch kurz Neoverse E2 angesprochen, diese Prozessoren sind beispielsweise für 5G-Basisstationen gedacht. Sie nutzen A510-Kerne mit DDR5, zudem PCIe Gen5 und CXL 2.0 für eine deutlich bessere Perfomance als Neoverse E1. Als nächste Plattformen stehen Poseidon (V3?) und Neoverse N3 auf der Roadmap.