ORNL Crusher: Mini-Exascale-Supercomputer geht an den Start

Dem US-amerikanischen Energieministerium (DoE) dürfte das nicht gefallen: Der ursprünglich für 2022 geplante Frontier-Supercomputer ist erst ab Januar 2023 einsatzbereit. Stattdessen wird eine Mini-Version davon in Betrieb genommen. Der Crusher(öffnet im neuen Fenster) steht ebenfalls am Oak Ridge National Laboratory (ORNL) und nutzt die gleiche Technik – wichtig, um erste Erfahrungen mit auf die Hardware optimierter Software zu sammeln.
Frontier wie Crusher nutzen AMD-Komponenten, wobei der große Supercomputer aus über 9.000(öffnet im neuen Fenster) und der Mini-Supercomputer(öffnet im neuen Fenster) aus gerade einmal 192 Nodes besteht: In jedem dieser Knoten stecken jeweils einem 64-kernige Epyc 7A53 alias Trento samt 512 GByte DDR4-3200-Arbeitsspeicher und vier Instinct MI250X . Trento ist eine angepasste Version der Epyc 7003 alias Milan mit Zen-3-Architektur, wobei unklar ist, welche Verbesserungen für das ORNL vorgenommen wurden.
Die Instinct MI250X sind AMDs aktuelle Beschleuniger, sie liegen als OAM (Open Compute Platform Accelerator Module) vor und kommunizieren untereinander sowie mit der CPU über das kohärente Infinity Fabric. Diese vom ORNL für den Crusher und später den Frontier verwendete HPC-Konfiguration nutzt die beste Verbindung, da beim Einsatz von zwei Prozessoren auf PCIe Gen4 zurückgegriffen werden muss.
Frontier wird vielleicht nicht der erste US-Exaflops-Supercomputer
Ausgehend von 192 Nodes, was anderthalb Cabinets entspricht, erreicht der Crusher rund 37 Petaflops an theoretischer GPU-Leistung und damit drastisch weniger als der für über 1,5 Exaflops ausgelegte Frontier. Die Performance ist jedoch hoch genug, um wissenschaftliche Berechnungen für unter anderem Astrophysik, Kernphysik, die Krebsforschung und neue Materialien vorzunehmen. Vier solcher Projekte wurden bereits portiert und der Code für die Crusher-Hardware optimiert.
Weil sich der Frontier bis Januar 2023 verzögert und auch der El Capitan des Lawrence Livermore National Laboratory (LLNL) frühestens Ende 2022 fertig wird, könnte doch der Aurora des Argonne National Laboratory (ANL) das erste Exaflops-System der USA werden. Hier werden Sapphire-Rapids-Xeons mit Ponte-Vecchio-Xe-HPC-Beschleunigern kombiniert, zuletzt musste Intel wegen der jahrelangen Verspätung aber sogar 300 Millionen US-Dollar an Strafe zahlen.
Derweil sollen in China schon zwei Exaflops-Supercomputer in Betrieb sein: Der Ocean Light nutzt die in Shanghai entwickelten SW26010 Pro, das System soll theoretisch 1,525 Exaflops bei doppelter Genauigkeit und 1,05 Exaflops im Linpack schaffen. Der Tianhe-3 mit ARM-basierten Phytium-CPUs und den in China entworfenen Matrix 2000+ als Beschleunigern soll auf eine Spitzenleistung von 1,7 Exaflops kommen.