A64FX: Fujitsu erläutert ARM-Chip für Japans Supercomputer

Der A64FX ist die erste CPU mit ARMs Vector-Erweiterung für Supercomputer. Laut Fujitsu rechnet der wassergekühlte Chip schnell und effizient. Er treibt das neue Post-K-System in Japan an.

Artikel veröffentlicht am ,
Prototyp der Hardware des Post-K-Supercomputers
Prototyp der Hardware des Post-K-Supercomputers (Bild: Fujitsu)

Fujitsu hat auf der Hot Chips 30 den A64FX vorgestellt. Der Prozessor hat nichts mit AMDs Athlon 64 FX zu tun, sondern ist eine ARM-basierte CPU für den japanischen Post-K-Supercomputer des Forschungsinstituts Rikagaku Kenkyujo (Riken) nahe Tokio. Der Chip unterstützt unterschiedliche Rechengenauigkeiten und ist der erste, der ARMs sogenannte Scalable Vector Extension (SVE) für Supercomputer mit einer Vektorlänge von 512 Bit integriert.

Stellenmarkt
  1. Leiter*in der IT-Abteilung (m/w/d) Bereich IT-Service-Management
    THOST Projektmanagement GmbH, Pforzheim
  2. Senior Cloud Engineer Azure - Cloud Engineer
    über grinnberg GmbH, deutschlandweit (Home-Office)
Detailsuche

Der A64FX ist High Performance Computing (HPC) und für künstliche Intelligenz ausgelegt - er kann mit FP64, mit FP32, mit INT16 und mit INT8 umgehen. Hier liefert er er bei 1,8 GHz zwischen über 3,4 Teraflops bis über 21,6 Teraops einen sehr hohen Durchsatz. Die praktische Rechenleistung und erreichte Datentransferrate liegt laut Fujitsu mit über 90 Prozent bei DGEMM und mit über 80 Prozent bei Stream Triad sehr nahe an den theoretischen Werten. Das macht den Chip effizient und verringert so die Kosten im Betrieb, welche bei einem Supercomputer enorm sind.

  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
Präsentation des A64FX (Bild: Fujitsu)

Hergestellt wird der Prozessor im 7-nm-Verfahren, er besteht aus 8,786 Milliarden Transistoren. Interessant ist dabei, dass das Package nur 594 Pins aufweist - ähnlich aufwendige CPUs haben viel mehr. Jeder A64FX hat 48 Compute-Kerne mit reiner 64-Bit-Unterstützung und vier weitere für Verwaltungsaufgaben. Daten erhält der Chip über vier HBM2-Stacks mit 32 GByte und einer Bandbreite von 1 TByte/s, die Node-Kommunikation übernimmt der Tofu-v3-Interconnect. Für Peripherie gibt es 16 PCIe-Gen3-Lanes.

Pro Chip gibt es vier CMGs (Core Memory Groups) mit 13 Cores und 8 MByte L2-Cache sowie einem mit 11 TByte/s extrem schnellen L1-Datenpuffer mit 64 KByte pro Kern. Der L1D ist laut Fujitsu besonders wichtig für den Durchsatz der beiden 512-Bit-Vector-Pipelines. Verglichen mit den Sparc64-XIfx-Chips im aktuellen K-Computer soll der A64FX im Durchschnitt grob die dreifache Geschwindigkeit bei HPC-Messungen und bis zu Faktor neun bei AI-Workloads aufweisen. Fujitsu nutzt Linux mit McKernel und angepassten Compilern und arbeitet eng mit dem Riken für die Software des Post-K zusammen.

Golem Karrierewelt
  1. Azure und AWS Cloudnutzung absichern: virtueller Zwei-Tage-Workshop
    22./23.09.2022, virtuell
  2. Blender Grundkurs: virtueller Drei-Tage-Workshop
    06.-08.09.2022, Virtuell
Weitere IT-Trainings

Der neue Supercomputer soll 2021 fertiggestellt sein, finale Performance-Angaben oder Werte zur Leistungsaufnahme des Post-K-Systems gibt es nicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed

Auch zu diesem Thema:



Aktuell auf der Startseite von Golem.de
Wissenschaft
LHC hat drei neue exotische Teilchen entdeckt

Der sogenannte Teilchenzoo der Physik ist noch größer geworden. Die Wissenschaft hofft auf Bestätigung der Modelle zu deren internen Aufbau.

Wissenschaft: LHC hat drei neue exotische Teilchen entdeckt
Artikel
  1. Superior Continuous Torque: E-Motor von Mahle für Dauerbetrieb unter Stress
    Superior Continuous Torque
    E-Motor von Mahle für Dauerbetrieb unter Stress

    Mahle hat einen neuen Auto-Elektromotor entwickelt, der unbegrenzt lange unter hoher Last betrieben werden kann. Dies wird durch ein neues Kühlkonzept im Motor erreicht.

  2. Security: BSI beginnt Zertifizierung für 5G-Komponenten
    Security
    BSI beginnt Zertifizierung für 5G-Komponenten

    Eine schnelle und zuverlässige IT-Sicherheitsaussage für die geprüften Produkte, das verspricht das BSI. Doch welche Produkte sind betroffen?

  3. VW.OS: VW-Software soll einfach updatefähig und bezahlbar sein
    VW.OS
    VW-Software soll "einfach updatefähig" und bezahlbar sein

    Mit seiner Softwaresparte Cariad will VW ein einheitliches System mit vereinfachter Architektur erstellen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bestellbar • HP HyperX Gaming-Headset -40% • Corsair Wakü 234,90€ • Samsung Galaxy S20 128GB -36% • Audible -70% • MSI RTX 3080 12GB günstig wie nie: 948€ • AMD Ryzen 7 günstig wie nie: 259€ • Der beste 2.000€-Gaming-PC • CM 34" UWQHD 144 Hz günstig wie nie: 467,85€ [Werbung]
    •  /