Abo
  • Services:

A64FX: Fujitsu erläutert ARM-Chip für Japans Supercomputer

Der A64FX ist die erste CPU mit ARMs Vector-Erweiterung für Supercomputer. Laut Fujitsu rechnet der wassergekühlte Chip schnell und effizient. Er treibt das neue Post-K-System in Japan an.

Artikel veröffentlicht am ,
Prototyp der Hardware des Post-K-Supercomputers
Prototyp der Hardware des Post-K-Supercomputers (Bild: Fujitsu)

Fujitsu hat auf der Hot Chips 30 den A64FX vorgestellt. Der Prozessor hat nichts mit AMDs Athlon 64 FX zu tun, sondern ist eine ARM-basierte CPU für den japanischen Post-K-Supercomputer des Forschungsinstituts Rikagaku Kenkyujo (Riken) nahe Tokio. Der Chip unterstützt unterschiedliche Rechengenauigkeiten und ist der erste, der ARMs sogenannte Scalable Vector Extension für Supercomputer mit einer Vektorlänge von 512 Bit integriert.

Stellenmarkt
  1. Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO, Stuttgart
  2. PARI GmbH, Starnberg, Weilheim

Der A64FX ist High Performance Computing (HPC) und für künstliche Intelligenz ausgelegt - er kann mit FP64, mit FP32, mit INT16 und mit INT8 umgehen. Hier liefert er zwischen über 2,7 Teraflops bis über 21,6 Teraops einen sehr hohen Durchsatz. Die praktische Rechenleistung und erreichte Datentransferrate liegt laut Fujitsu mit über 90 Prozent bei DGEMM und mit über 80 Prozent bei Stream Triad sehr nahe an den theoretischen Werten. Das macht den Chip effizient und verringert so die Kosten im Betrieb, welche bei einem Supercomputer enorm sind.

  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
Präsentation des A64FX (Bild: Fujitsu)

Hergestellt wird der Prozessor im 7-nm-Verfahren, er besteht aus 8,786 Milliarden Transistoren. Interessant ist dabei, dass das Package nur 594 Pins aufweist - ähnlich aufwendige CPUs haben viel mehr. Jeder A64FX hat 48 Compute-Kerne mit reiner 64-Bit-Unterstützung und vier weitere für Verwaltungsaufgaben. Daten erhält der Chip über vier HBM2-Stacks mit 32 GByte und einer Bandbreite von 1 TByte/s, die Node-Kommunikation übernimmt der Tofu-v3-Interconnect. Für Peripherie gibt es 16 PCIe-Gen3-Lanes.

Pro Chip gibt es vier CMGs (Core Memory Groups) mit 13 Cores und 8 MByte L2-Cache sowie einem mit 11 TByte/s extrem schnellen L1-Datenpuffer mit 64 KByte pro Kern. Der L1D ist laut Fujitsu besonders wichtig für den Durchsatz der beiden 512-Bit-Vector-Pipelines. Verglichen mit den Sparc64-XIfx-Chips im aktuellen K-Computer soll der A64FX im Durchschnitt grob die dreifache Geschwindigkeit bei HPC-Messungen und bis zu Faktor neun bei AI-Workloads aufweisen. Fujitsu nutzt Linux mit McKernel und angepassten Compilern und arbeitet eng mit dem Riken für die Software des Post-K zusammen.

Der neue Supercomputer soll 2021 fertiggestellt sein, finale Performance-Angaben oder Werte zur Leistungsaufnahme des Post-K-Systems gibt es nicht.

Auch zu diesem Thema:



Anzeige
Hardware-Angebote
  1. 216,50€
  2. 349,00€ (inkl. Call of Duty: Black Ops 4 & Fortnite Counterattack Set)

Folgen Sie uns
       


Far Cry New Dawn - Test

Far Cry New Dawn ist eine wesentlich rundere und damit spaßigere Version von Far Cry 5 - wenn man über den Ingame-Shop hinwegsieht.

Far Cry New Dawn - Test Video aufrufen
Marsrover Opportunity: Mission erfolgreich abgeschlossen
Marsrover Opportunity
Mission erfolgreich abgeschlossen

15 Jahre nach der Landung auf dem Mars erklärt die Nasa das Ende der Mission des Marsrovers Opportunity. Ein Rückblick auf das Ende der Mission und die Messinstrumente, denen wir viele neue Erkenntnisse über den Mars zu verdanken haben.
Von Frank Wunderlich-Pfeiffer

  1. Mars Insight Nasa hofft auf Langeweile auf dem Mars
  2. Astronomie Flüssiges Wasser auf dem Mars war Messfehler
  3. Mars Die Nasa gibt den Rover nicht auf

Digitaler Hausfriedensbruch: Bund warnt vor Verschärfung der Hackerparagrafen
Digitaler Hausfriedensbruch
Bund warnt vor Verschärfung der Hackerparagrafen

Ein Jahr Haft für das unbefugte Einschalten eines smarten Fernsehers? Unions-Politiker aus den Bundesländern überbieten sich gerade mit Forderungen, die Strafen für Hacker zu erhöhen und den Ermittlern mehr Befugnisse zu erteilen. Doch da will die Bundesregierung nicht mitmachen.
Von Friedhelm Greis

  1. Runc Sicherheitslücke ermöglicht Übernahme von Container-Host
  2. Security Metasploit 5.0 verbessert Datenbank und Automatisierungs-API
  3. Datenbank Fehler in SQLite ermöglichte Codeausführung

EU-Urheberrecht: Die verdorbene Reform
EU-Urheberrecht
Die verdorbene Reform

Mit dem Verhandlungsergebnis zur EU-Urheberrechtsrichtlinie ist eigentlich niemand zufrieden. Die Einführung von Leistungsschutzrecht und Uploadfiltern sollte daher komplett gestoppt werden.
Ein IMHO von Friedhelm Greis

  1. Uploadfilter Fast 5 Millionen Unterschriften gegen Urheberrechtsreform
  2. Uploadfilter EU-Kommission bezeichnet Reformkritiker als "Mob"
  3. Leistungsschutzrecht und Uploadfilter EU-Unterhändler einigen sich auf Urheberrechtsreform

    •  /