Nvidia Ampere: Spezifikationen von RTX 3090/3080 durchgesickert

Wenige Tage vor der offiziellen Vorstellung der Geforce RTX 3000 (Ampere) scheinen die technischen Daten festzustehen: Wie Videocardz(öffnet im neuen Fenster) berichtet, wurden diese unter anderem beim Grafikkartenhersteller Gainward(öffnet im neuen Fenster) bestätigt. Auffällig sind thermische Verlustleistung und Speichertransferrate verglichen zu der Geforce RTX 2000 (Turing). Die Menge an Shader-Einheiten sowie deren Takt steigt hingegen deutlich weniger an.
Die Geforce RTX 3090 als vorläufiges Topmodell soll auf dem GA102-Chip basieren. Sie nutzt 5.248 ALUs und damit mehr als die aktuelle Titan RTX. Das Interface fällt mit 384 Bit gleich breit aus, auch 24 GByte Videospeicher entsprechen der bisherigen Topkarte. Die GDDR6X-Speicherfrequenz liegt bei satten 19,5 GBit/s und die so erzielte Bandbreite immerhin 26 Prozent darüber. Verglichen mit der Geforce RTX 2080 Ti erhöht sich die Transferrate um 52 Prozent und die ALU-Menge um 21 Prozent, die Board-Power ist mit 350 Watt enorm.
Bei der Geforce RTX 3080 kommt ebenfalls der GA102 zum Einsatz, mit 4.352 ALUs entspricht die Konfiguration jener der Geforce RTX 2080 Ti. Das Interface fällt mit 320 Bit statt 352 Bit weniger breit aus, die Geschwindigkeit mit 19 GBit/s allerdings deutlich höher. Die Geforce RTX 3080 hat somit 23 Prozent mehr Bandbreite als die Geforce RTX 2080 Ti, verglichen zur Geforce RTX 2080 sind es 70 Prozent Zuwachs bei 48 Prozent mehr ALUs. Mit 320 Watt benötigt die Geforce RTX 3080 ebenfalls sehr viel Energie.
| RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RTX 3080 (12GB) | RTX 3080 (10GB) | RTX 3070 Ti | RTX 3070 | RTX 3060 Ti Plus | RTX 3060 Ti | RTX 3060 | RTX 3050 | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Chip | GA102-350-A1 (Vollausbau) | GA102-300-A1 (teilaktiviert) | GA102-225-A1 (teilaktiviert) | GA102-220-A1 (teilaktiviert) | GA102-200-KD-A1 (teilaktiviert) | GA104-400-A1 (Vollausbau) | GA104-300-A1 (teilaktiviert) | GA104-200-A1 (teilaktiviert) | GA104-200-A1 (teilaktiviert) | GA106-300-A1 (teilaktiviert) | GA106-150-KA-A1 (teilaktiviert) |
| FP32-ALUs | 10.752 (84 SMs, 7 GPCs) | 10.496 (82 SMs, 7 GPCs) | 10.240 (80 SMs, 7 GPCs) | 8.960 (70 SMs, 6 GPCs) | 8.704 (68 SMs, 6 GPCs) | 6.144 (48 SMs, 6 GPCs) | 5.888 (46 SMs, 6 GPCs) | 4.864 (38 SMs, 5 GPCs) | 4.864 (38 SMs, 5 GPCs) | 3.584 (28 SMs, 3 GPCs) | 2.560 (20 SMs, 2 GPCs) |
| TMUs | 336 | 328 | 320 | 280 | 272 | 192 | 184 | 152 | 152 | 112 | 80 |
| RT-Cores v2 | 84 | 82 | 80 | 70 | 68 | 48 | 46 | 38 | 38 | 28 | 20 |
| Tensor-Cores v3 | 336 | 328 | 320 | 280 | 272 | 192 | 184 | 152 | 152 | 112 | 80 |
| Basis/Boost-Takt | 1.560/1.860 MHz | 1.400/1.700 MHz | 1.365/1.665 MHz | 1.260/1.755 | 1.440/1.710 MHz | 1.575/1.770 MHz | 1.500/1.730 MHz | 1.410/1.680 MHz | 1.410/1.665 MHz | 1.320/1.777 MHz | 1.552/1.777 MHz |
| Videospeicher | 24 GByte GDDR6X | 24 GByte GDDR6X | 12 GByte GDDR6X | 12 GByte GDDR6X | 10 GByte GDDR6X | 8 GByte GDDR6X | 8 GByte GDDR6 | 8 GByte GDDR6X | 8 GByte GDDR6 | 12 GByte GDDR6 | 8 GByte GDDR6 |
| Geschwindigkeit | 21 GBit/s | 19,5 GBit/s | 19 GBit/s | 19 GBit/s | 19 GBit/s | 19 GBit/s | 14 GBit/s | 19 GBit/s | 14 GBit/s | 15 GBit/s | 14 GBit/s |
| Interface | 384 Bit | 384 Bit | 384 Bit | 384 Bit | 320 Bit | 256 Bit | 256 Bit | 256 Bit | 256 Bit | 192 Bit | 128 Bit |
| Bandbreite | 1.008 GByte/s | 936 GByte/s | 912 GByte/s | 912 GByte/s | 760 GByte/s | 608 GByte/s | 448 GByte/s | 608 GByte/s | 448 GByte/s | 360 GByte/s | 224 GByte/s |
| ROPs | 112 | 112 | 112 | 112 | 96 | 96 | 96 | 80 | 80 | 48 | 32 |
| Board-Power | 450 Watt | 350 Watt | 350 Watt | 350 Watt | 320 Watt | 290 Watt | 220 Watt | 200 Watt | 200 Watt | 170 Watt | 130 Watt |
| Stromanschluss | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x Mini-12P | 1x 8P | 1x 8P |
| PCIe | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x16 | Gen4 x8 |
| NV-Link | ja | ja | nein | nein | nein | nein | nein | nein | nein | nein | nein |
| Launch-Preis | 1.700 Euro | 1.500 Euro (1.500 US-Dollar) | 1.200 Euro (1.200 US-Dollar) | 1.000 Euro | 700 Euro (700 US-Dollar) | 620 Euro (600 US-Dollar) | 500 Euro (500 US-Dollar) | (?) | 400 Euro (400 US-Dollar) | 330 Euro (330 US-Dollar) | 280 Euro (250 US-Dollar) |
Es ist anzunehmen, dass die Ampere-Architektur pro Takt schneller rechnet als die Turing-Technik. Hinzu kommt eine unbekannte Anzahl an RT-Cores der zweiten Generation und an Tensor-Cores der dritten Generation. Die Leistung für Raytracing und DLSS dürfte daher signifikant höher ausfallen als bisher. War bisher die Rede von Samsungs 8LPP-Verfahren für wenigstens den GA102-Chip, führt Gainward als Fertigungstechnik jedoch 7 nm an - der Auftragsproduzent könnte also auch TSMC sein.