Zum Hauptinhalt Zur Navigation

Viel günstiger, viel langsamer: Nvidia entwickelt Chip für chinesische KI-Rechenzentren

Für den wichtigen chinesischen Markt muss Nvidia seine Server- GPUs weiter einschränken. Der neue Blackwell-Chip basiert auf der Workstation-Variante.
/ Johannes Hiltscher
3 Kommentare News folgen (öffnet im neuen Fenster)
Nvidia-CEO Jensen Huang, hier bei der Konferenz Siggraph, versucht mit einem neuen Chip, in China den Fuß im KI-Markt zu behalten. (Bild: Nvidia)
Nvidia-CEO Jensen Huang, hier bei der Konferenz Siggraph, versucht mit einem neuen Chip, in China den Fuß im KI-Markt zu behalten. Bild: Nvidia

In den vergangenen Jahren haben sich die US-Regierung und Nvidia ein ständiges Katz-und-Maus-Spiel geliefert: Die Regierung, egal ob unter Joe Biden oder Donald Trump, versucht, die Volksrepublik China von leistungsfähigen KI-Beschleunigern abzuschneiden, Nvidia will diesen wichtigen Markt allerdings nicht aufgeben. Wie die Nachrichtenagentur Reuters berichtet(öffnet im neuen Fenster) , geht der Wettlauf nach dem faktischen Exportverbot für die H20 nun in die nächste Runde.

So soll Nvidia aktuell an einem neuen Blackwell-Chip arbeiten, der den aktuellen Bestimmungen für den Export in die Volksrepublik entspricht. Anders als bislang soll es sich dabei allerdings nicht um eine Variante der B200-Rechenzentrums-GPU handeln. Selbst beim Vorgänger Hopper sieht Nvidia keine Möglichkeiten, diesen exportfähig umzugestalten. Als Basis dient vielmehr der GB202-Chip, der auch in der RTX-6000-Reihe für Workstations verbaut ist. Selbst den muss Nvidia deutlich einschränken, da er auf einen TPP-Wert ( Total Processing Performance, g+ ) von 16.000 kommt – erlaubt sind 4.800.

Der neue Beschleuniger – als mögliche Namen kursieren aktuell B40 oder RTX 6000D – wird zudem statt leistungsfähigem High Bandwidth Memory (HBM) GDDR7-Speicher nutzen. Die US-Regierung hatte jüngst, nach der Rechenleistung, auch die erlaubte Speicherbandbreite beschränkt. Das hat zur Folge, dass Nvidia nicht nur günstigeren Speicher, sondern auch einfachere Packaging-Techniken nutzen kann. Entsprechend kursiert ein Preis von 6.500 bis 8.000 US-Dollar.

Reicht Cuda als Argument?

Damit wäre die Variante für den chinesischen Markt zwar deutlich günstiger als die B200-Systeme. Im Blick auf die Leistung verliert sie, verglichen mit Huaweis Ascend 910B und 910C , allerdings auch an Attraktivität.

Die Ascend 910C soll umgerechnet nur rund 2.600 Euro kosten , erreicht dank HBM2 aber eine höhere Speicherbandbreite. Und Huawei soll bereits an der nächsten Generation arbeiten, auch wenn unklar ist , ob hierfür wieder Chips auf Umwegen beschafft werden müssten. Das könnte für Nvidia zum Problem werden: Zwar ist noch unklar, ob die neue GPU mit Nvlink vernetzt werden kann – was gegenüber PCIe eine höhere Bandbreite bietet -, absehbar wäre aber Cuda das Hauptargument für Nvidia-GPUs.

Ob das noch im großen Stil Kunden überzeugt, ist unsicher, zumal Huaweis Ascend 910B bereits im Vergleich zu Nvidias H100 beim KI-Training einen Kostenvorteil haben soll . Nvidias Marktanteil in der Volksrepublik, der zuletzt bei 50 Prozent gelegen haben soll, droht damit weiter zu sinken. Dennoch machte das Unternehmen in China zuletzt 13 Prozent seines Umsatzes – und befürchtet bereits herbe Umsatzeinbußen .


Relevante Themen