Ampere-Grafikkarte: Nvidia bringt A100-Beschleuniger mit PCIe Gen4

Die steckbare Ampere-Karte hat eine geringere Leistungsaufnahme und ist kompatibler zu mehr Systemen.

Artikel veröffentlicht am ,
A100 als PCIe-Gen4-Steckkarte und als SMX4-Mezzanine-Modul
A100 als PCIe-Gen4-Steckkarte und als SMX4-Mezzanine-Modul (Bild: Nvidia)

Nvidia hat einen PCIe-Gen4-Ableger des A100-Beschleunigers für Server vorgestellt, welcher die SMX4-Variante des Nvidia A100 für Supercomputer ergänzt. Die Steckkarte ist etwas langsamer, lässt sich aber in mehr Systemen einsetzen, da auf den Mezzanine-Formfaktor verzichtet wird.

Stellenmarkt
  1. Applikationsverantwortlicher für IT-Fachverfahren (m/w/d)
    operational services GmbH & Co. KG, Nürnberg
  2. SAP FI/CO Berater (m/w/x)
    über duerenhoff GmbH, Raum Berlin
Detailsuche

Schon bei der Tesla V100 gab es zwei Varianten, die jedoch unterschiedliche Taktraten aufwiesen. Beim A100-Beschleuniger hingegen gibt Nvidia die gleichen Frequenzen für die PCIe-Gen4- und die SMX4-Version an. Einziger Unterschied ist die maximale Leistungsaufnahme, welche mit 250 Watt statt 400 Watt deutlich niedriger ausfällt und somit auch die effektiv zu erreichenden Frequenzen begrenzt.

Technische Basis beider Modelle ist der mit 826 mm² riesige GA100-Chip mit Ampere-Architektur, den Nvidia in einem 7-nm-Verfahren beim Auftragsfertiger TSMC produzieren lässt. Die GPU bringt es im Vollausbau auf 128 SMs (8.192 ALUs), zudem gibt es ein 6.144-Bit-Interface mit 48 GByte HBM2-Videospeicher. Bei den A100-Beschleunigern sind jedoch nur 108 SMs (6.912 ALUs) sowie 5.120 Bit mit 40 GByte freigeschaltet; es fehlen also Shader-Einheiten und ein Speichercontroller ist deaktiviert. Die PCIe-Steckkarte wird passiv gekühlt, sie weist keine Display-Ausgänge auf.

  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
  • Präsentation zu A100 (Bild: Nvidia)
Präsentation zu A100 (Bild: Nvidia)
Tesla V100 (SXM2)Nvidia A100 (SXM4)Nvidia A100 (PCIe)
GPU (µArch)GV100 (Volta), teilaktiviertGA100 (Ampere), teilaktiviertGA100 (Ampere), teilaktiviert
Node12FFN (TSMC)7N (TSMC)7N (TSMC)
Transistoren21,1 Milliarden54,2 Milliarden54,2 Milliarden
ALUs / Tensor5.120 / 6406.912 / 4326.912 / 432
Speicher32 GByte HBM240 GByte HBM2 / 80 GByte HBM2e40 GByte HBM2
Bandbreite900 GByte/s1,555 TByte/s bzw über 2 TByte/s1,555 TByte/s
FP647,45 Teraflops9,7 (19,5*) Teraflops9,7 (19,5*) Teraflops
FP3214,9 Teraflops19,5 Teraflops19,5 Teraflops
FP16125 Teraflops312 (624**) Teraflops312 (624**) Teraflops
INT862 Teraops624 (1.248**) Teraops624 (1.248**) Teraops
TDP300 Watt400 Watt250 Watt
NV-Link300 GByte/s (8x GPUs)600 GByte/s (8x GPUs)600 GByte/s (2x GPUs)
InterfacePCIe Gen3PCIe Gen4PCIe Gen4
Technische Daten von Nvidias Tesla V100 und A100 *viaTensor Cores **mit Sparsity

Der Fokus der zwei Nvidia A100 liegt auf künstlicher Intelligenz, weshalb die integrierten Tensor-Cores für eine hohe INT8- und FP16-Leistung optimiert wurden. Die reguläre FP32- und FP64-Geschwindigkeit steigt verglichen mit der Tesla V100 hingegen weniger an. Nvidia zufolge werden die A100-Beschleuniger in Supercomputern wie dem Horeka, dem Juwels, dem Perlmutter, dem Raven-GPU und dem Theta-GPU eingesetzt. Zudem bieten Partner wie Asus, Atos, Cisco, Dell, Fujitsu, Gigabyte, HPE, Inspur, Lenovo und Supermicro entsprechende Serversysteme mit Nvidias A100 an. Als Cloud-Anbieter sind Alibaba, AWS, Baidu, Google, Microsoft, Oracle und Tencent mit dabei.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Core-i-13000
Intel präsentiert Raptor Lake mit bis zu 5,8 GHz

Auf der Innovation hat Intel die 13. Core Generation vorgestellt. Kernzahl, Takt und Effizienz sollen deutlich steigen.

Core-i-13000: Intel präsentiert Raptor Lake mit bis zu 5,8 GHz
Artikel
  1. Ukrainekrieg: Meta stoppt ausgefeilte russische Desinformationskampagne
    Ukrainekrieg
    Meta stoppt ausgefeilte russische Desinformationskampagne

    Gefakte Webseiten deutscher Medien machen Stimmung gegen die Russland-Sanktionen. Die falschen Artikel wurden über soziale Medien verbreitet.

  2. Polizei NRW: Palantir-Software verteuert sich drastisch
    Polizei NRW
    Palantir-Software verteuert sich drastisch

    Nordrhein-Westfalen muss deutlich mehr Geld für eine Datenbanksoftware ausgeben. Doch es sollen damit schon Straftaten verhindert worden sein.

  3. Creative Commons, Pixabay, Unsplash: Rechtliche Fallstricke bei Gratis-Stockfotos
    Creative Commons, Pixabay, Unsplash
    Rechtliche Fallstricke bei Gratis-Stockfotos

    Pixabay, Unsplash, CC ermöglichen eine gebührenfreie Nutzung kreativer Werke. Vorsicht ist dennoch geboten: vor Abmahnmaschen, falschen Quellenangaben, unklarer Rechtslage.
    Eine Analyse von Florian Zandt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AMD Ryzen 7000 jetzt bestellbar • CyberWeek: PC-Tower, Cooling & Co. • Günstig wie nie: Asus RX 6700 XT 539€, Acer 31,5" 4K 144 Hz 899€, MSI RTX 3090 1.159€ • AMD Ryzen 7 5800X 287,99€ • Xbox Wireless Controller 49,99€ • MindStar (Gigabyte RTX 3060 Ti 522€) [Werbung]
    •  /