Zum Hauptinhalt Zur Navigation

Nvidia A800: Rechen-GPU für China ist deutlich langsamer

Dass die China-Variante von Nvidias A100 langsamer ist, war absehbar, wie deutlich, bislang nicht. Dennoch ist sie extrem beliebt.
/ Johannes Hiltscher
Kommentare News folgen (öffnet im neuen Fenster)
Wer in China eine Rechen-GPU von Nvidia kaufen möchte, muss sich mit weniger Leistung zufriedengeben. (Bild: Nvidia, Flickr; Montage: Golem.de)
Wer in China eine Rechen-GPU von Nvidia kaufen möchte, muss sich mit weniger Leistung zufriedengeben. Bild: Nvidia, Flickr; Montage: Golem.de

Einige seiner Rechen-GPUs verkauft Nvidia nur in China: Die beiden 800er-Modelle A800 und den Nachfolger H800 stellte das Unternehmen exklusiv für den chinesischen Markt vor. Sie sind eine Reaktion auf Beschränkungen der US-Regierung für den Export leistungsfähiger Rechentechnik in die Volksrepublik. Zur Leistung hat Nvidia bislang keine Aussagen gemacht, die liefert nun das chinesische Portal Mydrivers(öffnet im neuen Fenster) (via Tom's Hardware(öffnet im neuen Fenster) ).

Laut Mydrivers hat Nvidia die Rechenleistung "auf etwa 70 Prozent der tatsächlichen Leistung der A100" beschnitten: Damit würde die A800 bei einfacher Genauigkeit (FP32) nur noch mit 109 statt 156 TFLOPS rechnen, mit den bei KI-Anwendungen beliebten FP16-Zahlen käme die Karte auf 218 TFlops. Das läge noch unter den Vorgaben der US-Regierung: Die erlaubt bei FP16 300 TFlops . Einen Lichtblick gibt es für Kunden: Bei dünn besetzten Matrizen kann das Feature Sparsity die Rechenleistung verdoppeln – und genau diese Art von Matrizen mit vielen Nullwerten ist bei KI-Anwendungen häufig, weshalb alle modernen Rechenbeschleuniger vergleichbare Fähigkeiten haben.

Die geringere Leistung kompensiert Nvidia mit einem etwas geringeren Preis: Laut Mydrivers soll die A800 rund 12.000 US-Dollar kosten, für die A100 hingegen verlangt das Unternehmen mindestens 15.000 US-Dollar. Spannend wird es bei der deutlich teureren H100: Die müsste Nvidia noch deutlich stärker drosseln, um den Exportrichtlinien zu entsprechen. Sie könnte dann schnell ökonomisch unattraktiv werden, für das Original verlangt Nvidia stattliche 33.000 US-Dollar .

Trotz Einschränkung die schnellste Karte

Eigentlicher Gegenstand der kurzen Nachricht von Mydrivers ist nicht die Rechenleistung der A800, sondern der Fakt, dass sie ausverkauft ist. Trotz der eingeschränkten Rechenleistung gibt es für KI-Unternehmen in China aktuell keine bessere Alternative. Zwar hatte das chinesische Unternehmen Biren eine eigene GPU mit noch deutlich höherer Leistung entwickelt.

Aufgrund der Exportbeschränkungen der US-Regierung musste die jedoch umgestaltet werden . Gefertigt werden die Chips nämlich in Taiwan bei TSMC in einem 7-nm-Prozess. Und TSMC hält sich an die Regeln der US-Regierung, um nicht selbst Ziel von Sanktionen zu werden. Eigentlich wollte Biren Testmuster seiner Rechen-GPUs BR100 und BR104 Ende 2022 anbieten – die Ankündigung erfolgte allerdings noch, bevor die US-Regierung die neuen Exportregeln verkündete.

Offiziell hatte Biren nur angekündigt, die Kommunikationsbandbreite zwischen den Karten reduziert zu haben. Doch auch die angekündigte Rechenleistung würde die Vorgaben aus den USA deutlich übersteigen – sie kann also kaum unverändert sein. Fraglich ist allerdings, wie bei Nvidia, wie genau die Anpassungen umgesetzt sind. Naheliegend wäre eine – umgehbare – Drosselung per Firmware.


Relevante Themen