Nvidia Geforce RTX 4090D: Ein exportfähiger Drache mit etwas weniger KI

Nvidia hat die Geforce RTX 4090D (Dragon)(öffnet im neuen Fenster) vorgestellt - fast. Denn eine offizielle Ankündigung blieb diesmal aus gutem Grund aus. Die Grafikkarte wurde eigens für Regionen entwickelt, in die Nvidia aufgrund der Exportgesetze der USA keine besonders leistungsfähigen KI-Beschleuniger mehr exportieren darf. Der Aufwand für die Anpassung dürfte überschaubar sein, frustriert sein könnte der Hersteller dennoch.
Den Spezifikationen nach ist die Grafikkarte rund neun Prozent langsamer als eine vollwertige RTX 4090 ( Test ). In der Praxis könnte dieser Wert geringer sein, denn je nach Szenario spielen die Speicherbandbreite und der L2-Cache ebenso eine Rolle, und hier ändert sich offenbar nichts. Die Datenübertragungsrate ist mit 1.008 GByte pro Sekunde identisch zur Geforce RTX 4090.
Auf der Nvidia Geforce RTX 4090D ist eine AD102-250-GPU mit 14.592 Shadereinheiten verbaut, 1.792 weniger als auf der AD102-300-A1-GPU einer normalen Geforce RTX 4090. Die Boost-Taktrate bleibt bei 2.520 MHz, den Basistakt hebt Nvidia sogar um 45 MHz an. Die maximale Leistungsaufnahme sinkt von 450 auf 425 Watt. Die Karte lässt sich außerdem nicht übertakten.
Win-Win-Situation oder sinnlose Haarspalterei?
Es ist unklar, ob Nvidia am L2-Cache oder den ROPs Änderungen vorgenommen hat, es deutet aber nichts darauf hin. Im Vorfeld wurde spekuliert, ob Nvidia beispielsweise gezielt die für KI wichtigen Tensor-Cores deaktivieren würde. Der Hersteller wählt den einfachen Weg und deaktiviert 14 weitere SMs. Der in den Exportregeln festgelegte TPP-Wert (Total Compute Power) dürfte damit bei etwa 4.700 liegen.
| Modell | Nvidia Geforce RTX 4090 D | Nvidia Geforce RTX 4090 |
|---|---|---|
| GPU | AD102-250 | AD102-300-A1 |
| TPP-Wert | ca. 4.700 | 5.280 |
| SUs | 14.592 | 16.384 |
| SMs | 114 | 128 |
| Tensor-Cores | 456 | 512 |
| Speicher (GByte) | 24 | 24 |
| Speichertyp | GDDR6X, 21 GBit/s | GDDR6X, 21 GBit/s |
| Speicherinterface | 384-Bit | 384-Bit |
| Speicherdurchsatzrate | 1.008 GByte/s | 1.008 GByte/s |
| Maximale Leistungsaufnahme | 425 Watt | 450 Watt (600) |
| Übertaktbar? | Nein | Ja |
In Summe kann dies nüchtern betrachtet wohl als Win-Win-Win zwischen dem US-Handelsministerium, Nvidia sowie Käufern in China und Vietnam gewertet werden. Jeder bekommt irgendwie, was er will. Und doch erscheint gerade diese Grafikkarte fast schon absurd. Denn niemand erreicht hier wirklich sein Ziel, lediglich Nvidia kann unter Umständen ein paar teildeaktivierte Chips verkaufen, für die der Hersteller sonst keine Verwendung gehabt hätte.
Ist es ausreichend, die Regeln genau einzuhalten?
Die KI-Performance der Grafikkarten wurde nicht wesentlich reduziert. Das für einige Bereiche wichtige Speicherinterface blieb gar unangetastet. US-Handelsministerin Gina Raimondo scheint sich dessen sogar bewusst gewesen zu sein , denn schon im Vorfeld kündigte sie sinngemäß an, dass die genaue Einhaltung der Exportgesetze nicht ausreiche.
Ob sie ihre Drohung mit einem Verbot noch wahrmacht, bleibt abzuwarten. Einen wirklichen Effekt dürften die Einschränkungen erst mit der Blackwell-Generation haben. In der Zwischenzeit entwickeln chinesische Unternehmen fleißig an eigenen Prozessoren und KI-GPUs , auch die Halbleiterindustrie wird in der Not inzwischen erfinderisch .
IMHO ist der Kommentar von Golem.de. IMHO = In My Humble Opinion (Meiner bescheidenen Meinung nach).



