A64FX: Fujitsu erläutert ARM-Chip für Japans Supercomputer
Der A64FX ist die erste CPU mit ARMs Vector-Erweiterung für Supercomputer. Laut Fujitsu rechnet der wassergekühlte Chip schnell und effizient. Er treibt das neue Post-K-System in Japan an.

Fujitsu hat auf der Hot Chips 30 den A64FX vorgestellt. Der Prozessor hat nichts mit AMDs Athlon 64 FX zu tun, sondern ist eine ARM-basierte CPU für den japanischen Post-K-Supercomputer des Forschungsinstituts Rikagaku Kenkyujo (Riken) nahe Tokio. Der Chip unterstützt unterschiedliche Rechengenauigkeiten und ist der erste, der ARMs sogenannte Scalable Vector Extension (SVE) für Supercomputer mit einer Vektorlänge von 512 Bit integriert.
Der A64FX ist High Performance Computing (HPC) und für künstliche Intelligenz ausgelegt - er kann mit FP64, mit FP32, mit INT16 und mit INT8 umgehen. Hier liefert er er bei 1,8 GHz zwischen über 3,4 Teraflops bis über 21,6 Teraops einen sehr hohen Durchsatz. Die praktische Rechenleistung und erreichte Datentransferrate liegt laut Fujitsu mit über 90 Prozent bei DGEMM und mit über 80 Prozent bei Stream Triad sehr nahe an den theoretischen Werten. Das macht den Chip effizient und verringert so die Kosten im Betrieb, welche bei einem Supercomputer enorm sind.
Hergestellt wird der Prozessor im 7-nm-Verfahren, er besteht aus 8,786 Milliarden Transistoren. Interessant ist dabei, dass das Package nur 594 Pins aufweist - ähnlich aufwendige CPUs haben viel mehr. Jeder A64FX hat 48 Compute-Kerne mit reiner 64-Bit-Unterstützung und vier weitere für Verwaltungsaufgaben. Daten erhält der Chip über vier HBM2-Stacks mit 32 GByte und einer Bandbreite von 1 TByte/s, die Node-Kommunikation übernimmt der Tofu-v3-Interconnect. Für Peripherie gibt es 16 PCIe-Gen3-Lanes.
Pro Chip gibt es vier CMGs (Core Memory Groups) mit 13 Cores und 8 MByte L2-Cache sowie einem mit 11 TByte/s extrem schnellen L1-Datenpuffer mit 64 KByte pro Kern. Der L1D ist laut Fujitsu besonders wichtig für den Durchsatz der beiden 512-Bit-Vector-Pipelines. Verglichen mit den Sparc64-XIfx-Chips im aktuellen K-Computer soll der A64FX im Durchschnitt grob die dreifache Geschwindigkeit bei HPC-Messungen und bis zu Faktor neun bei AI-Workloads aufweisen. Fujitsu nutzt Linux mit McKernel und angepassten Compilern und arbeitet eng mit dem Riken für die Software des Post-K zusammen.
Der neue Supercomputer soll 2021 fertiggestellt sein, finale Performance-Angaben oder Werte zur Leistungsaufnahme des Post-K-Systems gibt es nicht.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed