Abo
  • IT-Karriere:

A64FX: Fujitsu erläutert ARM-Chip für Japans Supercomputer

Der A64FX ist die erste CPU mit ARMs Vector-Erweiterung für Supercomputer. Laut Fujitsu rechnet der wassergekühlte Chip schnell und effizient. Er treibt das neue Post-K-System in Japan an.

Artikel veröffentlicht am ,
Prototyp der Hardware des Post-K-Supercomputers
Prototyp der Hardware des Post-K-Supercomputers (Bild: Fujitsu)

Fujitsu hat auf der Hot Chips 30 den A64FX vorgestellt. Der Prozessor hat nichts mit AMDs Athlon 64 FX zu tun, sondern ist eine ARM-basierte CPU für den japanischen Post-K-Supercomputer des Forschungsinstituts Rikagaku Kenkyujo (Riken) nahe Tokio. Der Chip unterstützt unterschiedliche Rechengenauigkeiten und ist der erste, der ARMs sogenannte Scalable Vector Extension für Supercomputer mit einer Vektorlänge von 512 Bit integriert.

Stellenmarkt
  1. IQTIG - Institut für Qualitätssicherung und Transparenz im Gesundheitswesen, Berlin
  2. Golem Media GmbH, Berlin

Der A64FX ist High Performance Computing (HPC) und für künstliche Intelligenz ausgelegt - er kann mit FP64, mit FP32, mit INT16 und mit INT8 umgehen. Hier liefert er zwischen über 2,7 Teraflops bis über 21,6 Teraops einen sehr hohen Durchsatz. Die praktische Rechenleistung und erreichte Datentransferrate liegt laut Fujitsu mit über 90 Prozent bei DGEMM und mit über 80 Prozent bei Stream Triad sehr nahe an den theoretischen Werten. Das macht den Chip effizient und verringert so die Kosten im Betrieb, welche bei einem Supercomputer enorm sind.

  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
Präsentation des A64FX (Bild: Fujitsu)

Hergestellt wird der Prozessor im 7-nm-Verfahren, er besteht aus 8,786 Milliarden Transistoren. Interessant ist dabei, dass das Package nur 594 Pins aufweist - ähnlich aufwendige CPUs haben viel mehr. Jeder A64FX hat 48 Compute-Kerne mit reiner 64-Bit-Unterstützung und vier weitere für Verwaltungsaufgaben. Daten erhält der Chip über vier HBM2-Stacks mit 32 GByte und einer Bandbreite von 1 TByte/s, die Node-Kommunikation übernimmt der Tofu-v3-Interconnect. Für Peripherie gibt es 16 PCIe-Gen3-Lanes.

Pro Chip gibt es vier CMGs (Core Memory Groups) mit 13 Cores und 8 MByte L2-Cache sowie einem mit 11 TByte/s extrem schnellen L1-Datenpuffer mit 64 KByte pro Kern. Der L1D ist laut Fujitsu besonders wichtig für den Durchsatz der beiden 512-Bit-Vector-Pipelines. Verglichen mit den Sparc64-XIfx-Chips im aktuellen K-Computer soll der A64FX im Durchschnitt grob die dreifache Geschwindigkeit bei HPC-Messungen und bis zu Faktor neun bei AI-Workloads aufweisen. Fujitsu nutzt Linux mit McKernel und angepassten Compilern und arbeitet eng mit dem Riken für die Software des Post-K zusammen.

Der neue Supercomputer soll 2021 fertiggestellt sein, finale Performance-Angaben oder Werte zur Leistungsaufnahme des Post-K-Systems gibt es nicht.

Auch zu diesem Thema:



Anzeige
Spiele-Angebote
  1. 4,99€
  2. 4,16€
  3. 4,99€

Folgen Sie uns
       


Raspberry Pi 4B - Test

Der Raspberry Pi kann endlich zur Konkurrenz aufschließen, aber richtig glücklich werden wir mit dem neuem Pi-Modell trotz bemerkenswerter Merkmale nicht.

Raspberry Pi 4B - Test Video aufrufen
Harmony OS: Die große Luftnummer von Huawei
Harmony OS
Die große Luftnummer von Huawei

Mit viel Medienaufmerksamkeit und großen Versprechungen hat Huawei sein eigenes Betriebssystem Harmony OS vorgestellt. Bei einer näheren Betrachtung bleibt von dem großen Wurf allerdings kaum etwas übrig.
Ein IMHO von Sebastian Grüner


    Schienenverkehr: Die Bahn hat wieder eine Vision
    Schienenverkehr
    Die Bahn hat wieder eine Vision

    Alle halbe Stunde von einer Stadt in die andere, keine langen Umsteigezeiten zur Regionalbahn mehr: Das verspricht der Deutschlandtakt der Deutschen Bahn. Zu schön, um wahr zu werden?
    Eine Analyse von Caspar Schwietering

    1. DB Navigator Deutsche Bahn lädt iOS-Nutzer in Betaphase ein
    2. One Fiber EWE will Bahn mit bundesweitem Glasfasernetz ausstatten
    3. VVS S-Bahn-Netz der Region Stuttgart bietet vollständig WLAN

    Smarte Wecker im Test: Unter den Blinden ist der Einäugige König
    Smarte Wecker im Test
    Unter den Blinden ist der Einäugige König

    Einen guten smarten Wecker zu bauen, ist offenbar gar nicht so einfach. Bei Amazons Echo Show 5 und Lenovos Smart Clock fehlen uns viele Basisfunktionen. Dafür ist einer der beiden ein besonders preisgünstiges und leistungsfähiges smartes Display.
    Ein Test von Ingo Pakalski

    1. Nest Hub im Test Google vermasselt es 1A

      •  /