HPC-Beschleuniger: Intels Ponte Vecchio holt Nvidias Hopper ein

52 Teraflops bei doppelter Genauigkeit: Mit Ponte Vecchio will Intel wieder einen schnellen Supercomputer-Beschleuniger abliefern.

Artikel veröffentlicht am ,
Das Package von Ponte Vecchio
Das Package von Ponte Vecchio (Bild: Computerbase)

Noch vor einigen Jahren waren viele Supercomputer weltweit mit Intels Xeon Phi genannten Beschleunigern bestückt. Nach deren Einstellung aber dominieren heute Modelle von Nvidia. Damit soll künftig Schluss sein: Mit Ponte Vecchio (PVC) will Intel zurück in den Markt, die reinen Performance-Daten sind absolut konkurrenzfähig.

Stellenmarkt
  1. Product Owner (m/f/d) for Hardware Security Modules
    Elektrobit Automotive GmbH, Erlangen
  2. IT-Systemkauffrau / -kaufmann m/w/d
    Stockmeier Holding GmbH, Bielefeld
Detailsuche

Ponte Vecchio wurde schon 2019 angekündigt, aufgrund von Verzögerungen bei der Fertigung aber immer wieder verschoben. Mittlerweile scheint das Design aber final zu sein, denn Intel gibt basierend auf entsprechenden Taktraten konkrete Flops-Werte an und zeigt diverse Benchmarks.

Der HPC-Beschleuniger besteht aus 41 aktiven Chiplets - von Intel als Tiles bezeichnet - und 9 passiven: Auf einem Interposer sitzen die Compute-Dies (Xe HPC), der Rambo-Cache, der Xe I/O-Link und der HBM2-Stapelspeicher. Verknüpft werden sie durch EMIB und Foveros, also 2.5D- sowie 3D-Stacking. Das Package sitzt auf einem OAM (Open Accelerator Modul) und wird mit 600 Watt betrieben, was typisch ist.

Grob vergleichbar mit Nvidia H100 Hopper

Insgesamt rechnen 128 Xe-Cores, was 16.384 Shader-Einheiten ergibt. Diese laufen mit 1,6 GHz und haben Zugriff auf 64 MByte L1- sowie enorme 408 MByte L2-Cache, dazu kommen 128 GByte an externem HBM2e-Stapelspeicher. Intel sagt, dass somit 52 Teraflops bei doppelter Genauigkeit (FP64) und bei einfacher Präzision (FP32) erreicht werden, zudem 419 Teraflops bei TF32. Für BF16/FP16 sind es 839 Teraflops und 1.678 Teraops bei INT8.

  • Hardware-Überblick von Ponte Vecchio (Bild: Intel)
  • Theoretische Performance von Ponte Vecchio (Bild: Intel)
  • Speicher-Subsystem von Ponte Vecchio (Bild: Intel)
  • Benchmarks von Ponte Vecchio (Bild: Intel)
  • Benchmarks von Ponte Vecchio (Bild: Intel)
  • Benchmarks von Ponte Vecchio (Bild: Intel)
  • Benchmarks von Ponte Vecchio (Bild: Intel)
  • Ponte Vecchio und Sapphire Rapids für Supercomputer (Bild: Intel)
Hardware-Überblick von Ponte Vecchio (Bild: Intel)
Intel Ponte VecchioNvidia H100 (SXM)AMD Instinct MI250X
GPU (µArch)Xe HPCGH100 (Hopper)2x Aldebaran (CDNA2)
Nodediverse (Intel+TSMC)4N EUV (TSMC)N6 EUV (TSMC)
Transistoren(?)80 Milliarden2x 29,1 Milliarden
ALUs16.384 (128 XeCs)15.872 (132 SMs)14.080 (220 CUs)
Speicher128 GByte HBM2e80 GByte HBM3128 GByte HBM2e
Bandbreite3,2 TByte/s3,07 TByte/s3,28 TByte/s
FP6452 Teraflops30 (60*) Teraflops47,9 (95,7***) Teraflops
FP3252 Teraflops60 Teraflops47,9 (95,7***) Teraflops
TF32419 Teraflops500 Teraflopsn.v.
BF16839 Teraflops1000* (2.000**) Teraflops383 Teraops***
FP16839 Teraflops1000* (2.000**) Teraflops383 Teraops***
INT81.678 Teraops2.000* (4.000**) Teraops383 Teraops***
TDP550 Watt700 Watt560 Watt
P2P(?)900 GByte/s (NV Link 4.0)800 GByte/s (8x IF Link)
PCIeGen5Gen5Gen4
FormfaktorOAMSXM5OAM
Technische Daten von Intels Ponte Vecchio *via Tensor Cores **mit Sparsity ***via Matrix Cores
Golem Karrierewelt
  1. DP-203 Data Engineering on Microsoft Azure: virtueller Vier-Tage-Workshop
    24.-27.10.2022, virtuell
  2. Deep Dive: Data Architecture mit Spark und Cloud Native: virtueller Ein-Tages-Workshop
    01.02.2023, Virtuell
Weitere IT-Trainings

Somit befindet sich die theoretische Rechenleistung in etwa auf dem Niveau von Nvidias H100 (Hopper). Dieser HPC-Beschleuniger soll ab dem dritten Quartal 2022 verfügbar sein. Intels Benchmarks vergleichen Ponte Vecchio mit dem älteren Nvidia A100 (Ampere) von 2020: Je nach Workload soll der Intel-Beschleuniger zwischen Faktor 1,40 und 2,48 vorne liegen. In Solvern wie NekRS soll der Vorsprung 30 bis 70 Prozent betragen, in Minibude und OpenMC ist Ponte Vecchio laut Intel doppelt so schnell.

Der Beschleuniger-Chip soll unter anderem im Aurora-Supercomputer verbaut werden, er wird mit den Sapphire Rapids genannten Xeon-CPU kombiniert. Die Einschübe bestehen aus vier Ponte Vecchio und zwei Prozessoren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Künstliche Intelligenz
Werden Computer so schlau wie Menschen?

Das Feld der künstlichen Intelligenz hat in den letzten zehn Jahren rasante Fortschritte gemacht. Wird der Computer den Menschen in puncto Intelligenz und Kreativität einholen? Und was dann?
Von Helmut Linde

Künstliche Intelligenz: Werden Computer so schlau wie Menschen?
Artikel
  1. Die große Umfrage: Das sind Deutschlands beste IT-Arbeitgeber 2023
    Die große Umfrage
    Das sind Deutschlands beste IT-Arbeitgeber 2023

    Golem.de und Statista haben 23.000 Fachkräfte nach ihrer Arbeit gefragt. Das Ergebnis ist eine Liste der 175 besten Unternehmen für IT-Profis.

  2. Monitoring von Container-Landschaften: Prometheus ist nicht alles
    Monitoring von Container-Landschaften
    Prometheus ist nicht alles

    Betreuer von Kubernetes und Co., die sich nicht ausreichend mit der Thematik beschäftigen, nehmen beim metrikbasierte Monitoring unwissentlich einige Nachteile in Kauf. Eventuell ist es notwendig, den üblichen Tool-Stack zu ergänzen.
    Von Valentin Höbel

  3. Linux: Version 6.0 ist fertig und veröffentlicht
    Linux
    Version 6.0 ist fertig und veröffentlicht

    Linus Torvalds hat die Linux-Version 6.0 wie geplant freigegeben. Patches für neue und alte Hardware stehen im Vordergrund.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • 3 Spiele für 49€ • Saturn Gutscheinheft • Günstig wie nie: LG OLED 48" 799€, Xbox Elite Controller 2 114,99€, AOC 28" 4K UHD 144 Hz 600,89€, Corsair RGB Midi-Tower 269,90€, Sandisk microSDXC 512GB 39€ • Bis zu 15% im eBay Restore • MindStar (PowerColor RX 6700 XT 489€) [Werbung]
    •  /