Instinct MI100: AMDs erster CDNA-Beschleuniger ist extrem schnell

Teils flotter als Nvidias A100: Mit der Instinct MI100 alias Arcturus will AMD im Supercomputer-Segment wieder vorne dabei sein.

Artikel veröffentlicht am ,
Instinct MI600 als PCIe-Karte
Instinct MI600 als PCIe-Karte (Bild: AMD)

AMD hat die Instinct MI100 vorgestellt, eine Steckkarte für HPC (High Performance Computing) wie Supercomputer. Der Beschleuniger hat keine Display-Ausgänge, die Arcturus-GPU der Instinct MI100 verzichtet gar auf die sonst übliche 3D-Pipeline (kein Crysis!), weshalb AMD auch gleich das Radeon aus dem Namen gestrichen hat. Die Fixed-Functions für Decoding/Encoding von H.265 und H.264 sowie VP9 sind jedoch erhalten geblieben; AV1 hingegen fehlt.

Stellenmarkt
  1. Cloud Platform Engineer / DevOps (m/f/d)
    PTV Group, Karlsruhe
  2. Mathematiker in der iGaming Branche (w/m/d)
    Gamomat Development GmbH, Berlin
Detailsuche

Für den Arcturus-Chip der Instinct MI100 ist AMD den gleichen Weg gegangen, den Nvidia schon beschreitet, wenngleich noch radikaler: Zwar spricht AMD noch von einer GPU (Graphics Processing Unit), faktisch handelt es sich aber um ein reines Compute-Design. Statt der RDNA(2)-Technik der Radeon RX kommt mit CDNA eine Architektur zum Einsatz, die für HPC ausgelegt ist.

Der Arcturus wird im N7P-DUV-Node beim Auftragsfertiger TSMC hergestellt, zur Die-Fläche und der Anzahl der Transistoren äußerte sich AMD nicht. Die GPU weist 120 (von 128) Compute Units bei 1.502 MHz auf, was 7.680 ALUs entspricht - die Radeon RX 6900 XT etwa bringt es auf nur 80 CUs und 5.120 Shader. Das 4.096 Bit breite Interface des Arcturus-Chip bindet 32 GByte HBM2-Stapelspeicher mit einer Datentransfer-Rate von 1,23 TByte/s an. Der L2-Cache fasst 8 MByte.

  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Präsentation zur Instinct MI100 (Bild: AMD)
  • Acht Instinct MI100 (Bild: AMD)
Präsentation zur Instinct MI100 (Bild: AMD)

Laut AMD beläuft sich die thermische Verlustleistung der PCIe-Gen4-Karte auf 300 Watt, die Kühlung erfolgt passiv - sprich: durch die Lüfter des Racks. Jede Instinct MI100 weist drei Infinity-Fabric-Links auf, womit die Beschleuniger ähnlich wie bei Nvidias NV-Link direkt miteinander kommunizieren können. Jeder IF-Link schafft 276 GByte/s, was ähnlich den 300 GByte/s von älterem NV-Link 2.0 mit PCIe Gen3 ist. Nvidias A100-Beschleuniger schaffen per NV-Link 3.0 allerdings 600 GByte/s.

Golem Akademie
  1. Linux-Systeme absichern und härten
    8.-10. November 2021, online
  2. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  3. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
Weitere IT-Trainings

Verglichen mit der bisherigen Radeon Instinct MI60 von 2018 liefert die Instinct MI100 eine drastisch höhere theoretische Rechengeschwindigkeit, bei der FP32- und FP64-Leistung wird sogar Nvidias A100 knapp geschlagen. Neu bei der CDNA-Technik des Arcturus-Chips sind die sogenannten Matrix Core Engines, welche Matrix-Multiplikationen mit Fp32/BF16/FP16 oder INT8/INT4 drastisch beschleunigen.

Golem HIGHEND

Die Tensor-v3-Cores des A100 sind allerdings bei manchen Operationen weiterhin schneller, auch unterstützen sie mit TF32 ein zusätzliches Format. Hinzu kommt die Tatsache, dass die Datentransfer-Rate des HBM2-Stapelspeichers mit 1,55 TByte/s flotter ausfällt und die A100 mit 40 GByte statt 32 GByte mehr Kapazität aufweisen. Für Hyperscaler-Racks bietet Nvidia die A100 überdies noch als SXM4-Mezzanine-Module mit 80 GByte und 400 Watt für eine effektiv höhere Geschwindigkeit an.

Nvidia A100 (PCIe)Radeon Instinct MI60Instinct MI100
GPU (µArch)GA100 (Ampere), teilaktiviertVega 20, VollausbauArcturus (CDNA1), teilaktiviert
Node7N (TSMC)N7 (TSMC)N7P (TSMC)
Transistoren54,2 Milliarden13,2 Milliarden(?)
ALUs6.9124.0967.680
Speicher40 GByte HBM232 GByte HBM232 GByte HBM2
Bandbreite1,555 TByte/s1,024 TByte/s1,23 TByte/s
FP649,7 (19,5*) Teraflops7,4 Teraflops11,5 Teraflops
FP3219,5 Teraflops14,7 Teraflops23,1 (46,2***) Teraflops
BF16312 (624**) Teraflopsn.v.92,3 Teraflops***
FP16312* (624**) Teraflops29,5 Teraflops184,6 Teraflops***
INT8624* (1.248**) Teraops58,9 Teraops184,6 Teraflops***
INT41.248* (2.496**) Teraops117,8 Teraops184,6 Teraflops***
TDP250 Watt300 Watt300 Watt
P2P-Link600 GByte/s (NV Link 3.0)184 GByte/s (2x IF Link)276 GByte/s (3x IF Link)
InterfacePCIe Gen4PCIe Gen4PCIe Gen4
Technische Daten von AMDs Instinct MI100 *via Tensor Cores **mit Sparsity ***via Matrix Cores

Ebenfalls sehr wichtig ist der Software-Stack, wo Nvidia mit dem CUDA-Umfeld den Markt bisher weitestgehend dominiert. Allerdings hat AMD mit der eigenen Radeon-Open-Compute-Plattform mittlerweile aufgeholt: ROCm v4.0 unterstützt einen HPC-Stack, zudem Frameworks wie Gridtools und Bibliotheken wie Kokkos und Magma.

Die Supercomputer-Kunden wissen das zu schätzen, weshalb Systeme wie der El Capitan künftig mit Instinct-Beschleunigern ausgestattet sind. Mit über 2 Exaflops wird der Supercomputer extrem schnell sein, er geht jedoch erst 2023 an den Start.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Rocketeer 17. Nov 2020

Jetzt mal ehrlich, so an dich als Besitzer eines LKWs für Umzüge. Ist es nicht ziemlich...

ms (Golem.de) 16. Nov 2020

Ist schon kurios mit INT8 und INT4, denn bei Vega 20 verdoppelt sich ja die Performance ...

ms (Golem.de) 16. Nov 2020

Jupp: https://www.golem.de/news/supercomputer-karte-nvidia-verdoppelt-videospeicher-des...

ms (Golem.de) 16. Nov 2020

/fixed



Aktuell auf der Startseite von Golem.de
William Shatner
Captain Kirk fliegt offenbar in die Erdumlaufbahn

Energie! Noch im Oktober 2021 fliegt William "Kirk" Shatner möglicherweise mit Jeff Bezos ins All.

William Shatner: Captain Kirk fliegt offenbar in die Erdumlaufbahn
Artikel
  1. Browser: Edge unterstützt Maus und Tastatur auf Xbox
    Browser
    Edge unterstützt Maus und Tastatur auf Xbox

    Microsoft hat Edge auf den aktuellen Xbox-Konsolen aktualisiert. Jetzt lässt sich der Browser fast wie am PC per Maus und Tastatur bedienen.

  2. 600 Millionen Euro: Bundeswehr lässt Funkgeräte von 1982 nachbauen
    600 Millionen Euro
    Bundeswehr lässt Funkgeräte von 1982 nachbauen

    Das SEM 80/90 mit 16 KBit/s wird exakt nachgebaut, zum Stückpreis von rund 20.000 Euro. Das Retrogerät geht für die Bundeswehr in Serie.

  3. MacOS Monterey Beta: Hinweise auf neues MacBook Pro 16 mit höherer Auflösung
    MacOS Monterey Beta
    Hinweise auf neues MacBook Pro 16 mit höherer Auflösung

    Die neueste Beta von MacOS Monterey beinhaltet Hinweise auf ein MacBook Pro 16 Zoll, welches ein Display mit 34.56 x 2.234 Pixel Auflösung haben soll.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Samsung Odyssey G7 499€ • Alternate (u. a. Thermaltake Level 20 RS ARGB 99,90€) • Samsung 980 1 TB 83€ • Lenovo IdeaPad Duet Chromebook 229€ • Lenovo-Laptops zu Bestpreisen • 19% auf Sony-TVs bei MM • Samsung SSD 980 Pro 1TB 150,50€ • AeroCool Cylon 4 ARGB 25,89€ [Werbung]
    •  /