• IT-Karriere:
  • Services:

Supercomputer-Beschleuniger: Nvidia verdoppelt Videospeicher des A100

Mit 80 GByte kann Nvidias aktualisierter A100-Supercomputer-Beschleuniger auf die doppelte Menge an Videospeicher zurückgreifen.

Artikel veröffentlicht am ,
HGX-A100-Rack mit acht A100-Beschleunigern
HGX-A100-Rack mit acht A100-Beschleunigern (Bild: Nvidia)

Nvidia hat den A100-Beschleuniger überarbeitet und wenige Monate nach der initialen Vorstellung mit doppelt so viel Videospeicher angekündigt. Statt 40 GByte sind 80 GByte verbaut, überdies steigt die Datentransfer-Rate um gut ein Viertel an. An den restlichen Eckdaten des A100-Beschleuniger ändert sich jedoch nichts.

Stellenmarkt
  1. dmTECH GmbH, Karlsruhe
  2. HUK-COBURG Versicherungsgruppe, Coburg

Den A100 - das Tesla hat Nvidia aus dem Namen gestrichen - gab es bisher in zwei Varianten: Als PCIe-Steckkarte und als SXM4-Mezzanine-Modul, wobei Letzteres mit 400 Watt statt 250 Watt effektiv deutlich höhere Taktraten fahren kann, was sich in den technischen Spezifikationen nicht direkt widerspiegelt. Die SXM4-Version ist auch jene, welche mit 80 GByte aktualisiert wird.

Konkret verwendet Nvidia statt HMB2-Stapelspeicher den verbesserten HBM2E-Stacked Memory, wie er von Samsungund von SK Hynix produziert wird. Das steht für High Bandwidth Memory 2nd Gen Enhanced und beschreibt verglichen mit HBM2 eine Version des Stapelspeichers mit höherer Geschwindigkeit und doppelter Kapazität. Dabei werden acht DRAM-Chips (8Hi) mit je 16 GBit statt 8 GBit durchkontaktiert, die Datenrate liegt derzeit bei bis zu 3,6 GBit/s statt bis zu 2,4 GBit/s.

  • A100-Beschleuniger als SXM4-Mezzanine-Modul (Bild: Nvidia)
  • HGX-A100-Rack mit acht A100-Beschleunigern (Bild: Nvidia)
A100-Beschleuniger als SXM4-Mezzanine-Modul (Bild: Nvidia)
Tesla V100 (SXM2)Nvidia A100 (SXM4)Nvidia A100 (PCIe)
GPU (µArch)GV100 (Volta), teilaktiviertGA100 (Ampere), teilaktiviertGA100 (Ampere), teilaktiviert
Node12FFN (TSMC)7N (TSMC)7N (TSMC)
Transistoren21,1 Milliarden54,2 Milliarden54,2 Milliarden
ALUs / Tensor5.120 / 6406.912 / 4326.912 / 432
Speicher32 GByte HBM240 GByte HBM2 / 80 GByte HBM2e40 GByte HBM2
Bandbreite900 GByte/s1,555 TByte/s bzw über 2 TByte/s1,555 TByte/s
FP647,45 Teraflops9,7 (19,5*) Teraflops9,7 (19,5*) Teraflops
FP3214,9 Teraflops19,5 Teraflops19,5 Teraflops
FP16125 Teraflops312 (624**) Teraflops312 (624**) Teraflops
INT862 Teraops624 (1.248**) Teraops624 (1.248**) Teraops
TDP300 Watt400 Watt250 Watt
NV-Link300 GByte/s (8x GPUs)600 GByte/s (8x GPUs)600 GByte/s (2x GPUs)
InterfacePCIe Gen3PCIe Gen4PCIe Gen4
Technische Daten von Nvidias Tesla V100 und A100 *viaTensor Cores **mit Sparsity

Wer sich nun das Rendering des SXM4-Mezzanine-Moduls des A100-Beschleunigers anschaut, wird sechs Stacks sehen - was bei 16 GByte pro Speicherstapel für 80 GByte nicht passt. Nvidia nutzt aus Gründen der Chip-Ausbeute (Yield) nur fünf aktive Stacks, der sechste ist ein mechanischer Dummy, der dazugehörige 1.024-Bit-Controller des GA100-Grafikprozessors wurde deaktiviert. Wie hoch die Geschwindigkeit der einzelnen Stapel ausfällt, sagte Nvidia nicht, nannte aber eine Transfer-Rate von über 2 TByte/s. Folgerichtig müssten die HBM2E-Stacks mit über 3 GBit/s statt zuvor 2,43 GBit/s laufen.

Nvidia verkauft den A100-Beschleuniger mit 80 GByte Videospeicher selbst noch im vierten Quartal 2020 als Teil der eigenen DGX-(Station)-A100-Systeme. Die HGX-A100-Racks für Hyperscale-Server, genauer: als Konfiguration mit vier oder acht Mezzanine-Modulen, folgen im ersten Halbjahr 2021. Diese Einschübe werden dann von Partnern wie Atos, Dell, Fujitsu, Gigabyte, HPE, Inspur, Lenovo, Quanta und Supermicro vertrieben.

Golem HIGHEND jetzt mit Ryzen 5000 und Radeon RX 6800 verfügbar

Parallel zu Nvidias aktualisiertem A100 hat AMD die Radeon Instinct MI100 vorgestellt, den ersten Supercomputer-Beschleuniger mit CDNA-Technik. Die PCIe-Steckkarte weist eine höhere theoretische FP32- und FP64-Rechenleistung auf, zudem unterstützt sie schnelle Matrix-Multiplikationen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 8,99€
  2. 7,59€
  3. 68,23€ (Release 03.12.)

Folgen Sie uns
       


Besuch beim Cyberbunker

Wir haben uns den ominösen Cyberbunker an der Mosel oberhalb von Traben-Trarbach von außen angeschaut.

Besuch beim Cyberbunker Video aufrufen
Librem Mini v2 im Test: Der kleine Graue mit dem freien Bios
Librem Mini v2 im Test
Der kleine Graue mit dem freien Bios

Der neue Librem Mini eignet sich nicht nur perfekt für Linux, sondern hat als einer von ganz wenigen Rechnern die freie Firmware Coreboot und einen abgesicherten Bootprozess.
Ein Test von Moritz Tremmel

  1. Purism Neuer Librem Mini mit Comet Lake
  2. Librem 14 Purism-Laptops bekommen 6 Kerne und 14-Zoll-Display
  3. Librem Mini Purism bringt NUC-artigen Mini-PC

CoD, Crysis, Dirt 5, Watch Dogs, WoW: Radeon-Raytracing kann auch schnell sein
CoD, Crysis, Dirt 5, Watch Dogs, WoW
Radeon-Raytracing kann auch schnell sein

Wer mit Raytracing zockt, hat je nach Titel mit einer Radeon RX 6800 statt einer Geforce RTX 3070 teilweise die besseren (Grafik-)Karten.
Ein Test von Marc Sauter


    Smarte Lautsprecher im Vergleichstest: Amazon hat den Besten
    Smarte Lautsprecher im Vergleichstest
    Amazon hat den Besten

    Echo 4, Nest Audio, Echo Dot 4 oder Homepod Mini? Bei smarten Lautsprechern für maximal 100 Euro ist die Größe entscheidend.
    Ein Test von Ingo Pakalski

    1. Smarter Lautsprecher Google zeigt Nest Audio für 100 Euro
    2. Harman Kardon Portabler Lautsprecher mit Google Assistant und Airplay 2
    3. Smarter Lautsprecher Google bestätigt offiziell neuen Nest-Lautsprecher

      •  /