Ampere-Grafikkarte: Nvidia bringt A100-Beschleuniger mit PCIe Gen4

Die steckbare Ampere-Karte hat eine geringere Leistungsaufnahme und ist kompatibler zu mehr Systemen.

Artikel veröffentlicht am ,
A100 als PCIe-Gen4-Steckkarte und als SMX4-Mezzanine-Modul
A100 als PCIe-Gen4-Steckkarte und als SMX4-Mezzanine-Modul (Bild: Nvidia)

Nvidia hat einen PCIe-Gen4-Ableger des A100-Beschleunigers für Server vorgestellt, welcher die SMX4-Variante des Nvidia A100 für Supercomputer ergänzt. Die Steckkarte ist etwas langsamer, lässt sich aber in mehr Systemen einsetzen, da auf den Mezzanine-Formfaktor verzichtet wird.

Stellenmarkt
  1. Ingenieur FH / Bachelor (m/w/d) der Fachrichtung Elektrotechnik, Nachrichtentechnik, Hochfrequenztechnik ... (m/w/d)
    Bayerisches Landeskriminalamt, Königsbrunn
  2. Softwareentwicklerin, Physikerin oder Ingenieurin (m/w/d)
    Helmholtz-Zentrum hereon GmbH, Geesthacht
Detailsuche

Schon bei der Tesla V100 gab es zwei Varianten, die jedoch unterschiedliche Taktraten aufwiesen. Beim A100-Beschleuniger hingegen gibt Nvidia die gleichen Frequenzen für die PCIe-Gen4- und die SMX4-Version an. Einziger Unterschied ist die maximale Leistungsaufnahme, welche mit 250 Watt statt 400 Watt deutlich niedriger ausfällt und somit auch die effektiv zu erreichenden Frequenzen begrenzt.

Technische Basis beider Modelle ist der mit 826 mm² riesige GA100-Chip mit Ampere-Architektur, den Nvidia in einem 7-nm-Verfahren beim Auftragsfertiger TSMC produzieren lässt. Die GPU bringt es im Vollausbau auf 128 SMs (8.192 ALUs), zudem gibt es ein 6.144-Bit-Interface mit 48 GByte HBM2-Videospeicher. Bei den A100-Beschleunigern sind jedoch nur 108 SMs (6.912 ALUs) sowie 5.120 Bit mit 40 GByte freigeschaltet; es fehlen also Shader-Einheiten und ein Speichercontroller ist deaktiviert. Die PCIe-Steckkarte wird passiv gekühlt, sie weist keine Display-Ausgänge auf.

  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
Präsentation zu A100 (Bild: Nvidia)
Tesla V100 (SXM2)Nvidia A100 (SXM4)Nvidia A100 (PCIe)
GPU (µArch)GV100 (Volta), teilaktiviertGA100 (Ampere), teilaktiviertGA100 (Ampere), teilaktiviert
Node12FFN (TSMC)7N (TSMC)7N (TSMC)
Transistoren21,1 Milliarden54,2 Milliarden54,2 Milliarden
ALUs / Tensor5.120 / 6406.912 / 4326.912 / 432
Speicher32 GByte HBM240 GByte HBM2 / 80 GByte HBM2e40 GByte HBM2
Bandbreite900 GByte/s1,555 TByte/s bzw über 2 TByte/s1,555 TByte/s
FP647,45 Teraflops9,7 (19,5*) Teraflops9,7 (19,5*) Teraflops
FP3214,9 Teraflops19,5 Teraflops19,5 Teraflops
FP16125 Teraflops312 (624**) Teraflops312 (624**) Teraflops
INT862 Teraops624 (1.248**) Teraops624 (1.248**) Teraops
TDP300 Watt400 Watt250 Watt
NV-Link300 GByte/s (8x GPUs)600 GByte/s (8x GPUs)600 GByte/s (2x GPUs)
InterfacePCIe Gen3PCIe Gen4PCIe Gen4
Technische Daten von Nvidias Tesla V100 und A100 *viaTensor Cores **mit Sparsity

Der Fokus der zwei Nvidia A100 liegt auf künstlicher Intelligenz, weshalb die integrierten Tensor-Cores für eine hohe INT8- und FP16-Leistung optimiert wurden. Die reguläre FP32- und FP64-Geschwindigkeit steigt verglichen mit der Tesla V100 hingegen weniger an. Nvidia zufolge werden die A100-Beschleuniger in Supercomputern wie dem Horeka, dem Juwels, dem Perlmutter, dem Raven-GPU und dem Theta-GPU eingesetzt. Zudem bieten Partner wie Asus, Atos, Cisco, Dell, Fujitsu, Gigabyte, HPE, Inspur, Lenovo und Supermicro entsprechende Serversysteme mit Nvidias A100 an. Als Cloud-Anbieter sind Alibaba, AWS, Baidu, Google, Microsoft, Oracle und Tencent mit dabei.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Microsoft
Das nächste große Update für Windows 10 kommt im November

Die Version 21H2 wurde wohl auch wegen Windows 11 etwas nach hinten verschoben. Der Patch soll nun aber im November für Windows 10 kommen.

Microsoft: Das nächste große Update für Windows 10 kommt im November
Artikel
  1. Silence S04: Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt
    Silence S04
    Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt

    Beim Elektroauto Silence S04 kann der Nutzer den Akku selbst wechseln, wenn dieser leergefahren ist.

  2. Truth Social: Trumps soziales Netz bekommt Probleme mit Hackern und Lizenz
    Truth Social
    Trumps soziales Netz bekommt Probleme mit Hackern und Lizenz

    Hacker starten in Trumps-Netzwerk einen "Online-Krieg gegen Hass" mit Memes. Der Code scheint illegal von Mastodon übernommen worden zu sein.

  3. Arduino und Python: Bastler nimmt Audiokassette als Speichermedium für Retro-PC
    Arduino und Python
    Bastler nimmt Audiokassette als Speichermedium für Retro-PC

    Die Kassette kann nicht nur Lieder speichern, sondern auch Bitmuster. Ein Bastler baut dafür eine Schnittstelle mit 1,5 KBit/s Datenrate.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AOC CQ32G2SE/BK 285,70€ • Dell Alienware AW2521H 360 Hz 499€ • Corsair Vengeance RGB PRO SL 64-GB-Kit 3600 253,64€ • DeepCool Castle 360EX 109,90€ • Phanteks Glacier One 240MP 105,89€ • Seagate SSDs & HDDs günstiger • Alternate (u. a. Thermaltake Core P3 TG Snow Ed. 121,89€) [Werbung]
    •  /