Prototyp oder Spezialversion?: Verbesserte Nvidia A100 in China entdeckt

Auf der Plattform X (via Wccftech) hat ein Nutzer von einer Vielzahl an Nvidia-A100-Prototypen berichtet(öffnet im neuen Fenster) , die auf chinesischen Onlinemarktplätzen für gebrauchte Hardware verfügbar sind. Woher genau die modifizierten Modelle stammen, ist nicht ganz klar. Auf den Karten ist deutlich mehr von der physisch vorhandenen Hardware nutzbar als auf regulären A100-PCIe-Karten. Eine simple Bios-Modifikation scheidet dafür aus.
Die Karten werden als Nvidia A100 7936SP bezeichnet, wobei die Zahl für die Anzahl der aktiven Streamprozessoren (Shading Units) steht. Eine reguläre A100 GPU für PCI-Express-Boards hat nur 6.912 aktive SPs und rechnet dadurch theoretisch knapp 15 Prozent langsamer. Außerdem nutzen die modifizierten A100-GPUs alle sechs HBM-Stacks, normalerweise sind es nur fünf.
Dadurch wird das Speicherinterface von ursprünglich 5.120 Bit auf 6.144 Bit vergrößert und die Übertragungsrate steigt von 1,94 TByte/s auf 2,16 TByte/s und statt 80 GByte sind die vollen 96 GByte nutzbar. Theoretisch müsste die Datenrate sogar noch höher sein, offenbar läuft der Speicher auf der A100 7936SP allerdings nur mit 2,8 GBit/s statt 3 GBit/s. Für große KI-Modelle ist sowohl die höhere Durchsatzrate als auch der größere Speicher vorteilhaft.
Herkunft unklar
Warum die offenbar schon im Jahr 2020 entwickelten Grafikkarten erst jetzt öffentlich bekannt und verfügbar werden, ist ungeklärt. Entweder handelt es sich um Prototypen aus Nvidias R&D-Abteilung, die ihren Weg auf den freien Markt gefunden haben, oder der Hersteller hat vor einigen Jahren leistungsfähigere Modelle für einen Großkunden entwickelt, die nun beim Wechsel zur nächsten Generation ausgetauscht und verkauft werden.
| Grafikkarte | Nvidia A100 40GB | Nvidia A100 80GB | Nvidia A100 7936SP 96GB |
| Architektur | Ampere (GA100) | Ampere (GA100) | Ampere (GA100) |
| Herstellungsprozess | TSMC 7N | TSMC 7N | TSMC 7N |
| Transistoren | 54,2 Milliarden | 54,2 Milliarden | 54,2 Milliarden |
| Chipfläche | 826 mm² | 826 mm² | 826 mm² |
| SMs | 108 | 108 | 124 |
| Cuda-Kerne | 6912 | 6912 | 7936 |
| Tensor-Kerne | 432 | 432 | 496 |
| Taktfrequenz (Basis/Boost) | 765/1410 MHz | 1.065/1410 MHz | 1.215/? MHz |
| FP16 Tflops | 312 | 312 | 358(?) |
| Speicher | 40 GByte HBM2e | 80 GByte HBM2e | 96 GByte HBM2e |
| Speicherinterface | 5120 Bit @ 1,56 TByte/s | 5120-Bit @ 1,94 TByte/s | 6144-Bit @ 2,16 TByte/s |
| TDP | 300 Watt | 300 Watt | 300 Watt |
Die Händler verlangen aktuell rund 18.000 US-Dollar für eine Nvidia A100 7936SP, wobei der Verkauf nach China unter der aktuellen US-Handelskontrollgesetzgebung illegal ist. Für Ware, die sich bereits im Land befindet, hat dies natürlich keine Auswirkungen. Gerade der Mangel an gut verfügbaren neuen Alternativen dürfte die Karten attraktiv machen, trotz fehlendem offiziellen Support durch Nvidia.



