Zum Hauptinhalt Zur Navigation

TU104 statt TU106: EVGA verkauft RTX 2060 KO mit höherer Rasterleistung

Bei der Geforce RTX 2060 setzt EVGA keinen TU106-Chip ein, sondern den TU104. Dadurch ist die KO-Edition in einigen Benchmarks deutlich flotter, als zu erwarten wäre. Grund dafür sind offenbar die Raster-Engines.
/ Marc Sauter
7 Kommentare News folgen (öffnet im neuen Fenster)
Geforce RTX 2060 KO (Bild: EVGA)
Geforce RTX 2060 KO Bild: EVGA

Vergangene Woche testete Gamers Nexus(öffnet im neuen Fenster) die Geforce RTX 2060 KO von EVGA(öffnet im neuen Fenster) und deren ungewöhnliche Performance-Resultate. Zwar stellen die Youtuber fest, dass die Grafikkarte einen TU104-Chip statt der sonst üblichen TU106 verwendet, liefern aber keine technische Erklärung für die höhere Geschwindigkeit bei bestimmten Workloads. Die ist jedoch relativ einfach, denn eine GPU besteht aus weit mehr als nur Shader-Rechenkernen.

Nvidia gliedert die Struktur seiner Grafikchips seit vielen Jahren in mehrere GPCs (Graphics Processor Clusters), welche die Anzahl der Raster-Engines festlegen. Jeder GPC umfasst dann einige TPCs (Texture Processing Clusters) mit den Polymorph-Engines für Tessellation und in den TPCs wiederum stecken die SMs (Shader Multiprocessors) mit den FP32/INT32-Einheiten. Alle Gruppen - GPCs, TPCs, SMs - sind einzeln abschaltbar.

Für eine Geforce RTX 2060 sieht Nvidia vor, dass diese 1.920 Shader-Kerne hat. Weil der TU106-Chip jedoch drei GPCs mit 18 TPCs für 36 SMs respektive 2.304 ALUs aufweist, deaktiviert der Hersteller davon drei TPCs in einem GPC. Die Geforce RTX 2060 hat also immer drei Graphics Processor Clusters und entsprechend auch drei Raster-Engines, da diese in den GPCs stecken.

Beim TU104-Chip hingegen gibt es sechs GPCs und somit auch sechs Raster-Engines, zudem 24 TPCs und ergo 48 SMs für 3.072 Shader-Kerne. Pro GPC gibt es vier TPCs statt sechs TPCs, weshalb nicht das gleiche Verhältnis besteht wie beim TU106. Um also den TU104-Chip auf 1.920 ALUs zu reduzieren, dürfte Nvidia schlicht zwei GPCs deaktivieren und dann in einem GPC noch zwei SMs abschalten.

Unterm Strich hat eine Geforce RTX 2060 mit TU106 also 3 GPCs, 15 TPCs, 30 SMs und 1.920 ALUs. Die Version mit TU104 hat aber vermutlich 4 GPCs und 16 TPCs sowie ebenfalls 30 SMs und 1.920 ALUs. Das würde dann in einem Drittel mehr Rasterleistung resultieren, die sich je nach Anwendungsfall deutlich bemerkbar macht. Hinzu kommt, dass sich beim TU104 auf GPC-Ebene diese Ressourcen weniger TPCs/SMs teilen müssen, was der Leistung ebenfalls zugutekommt.

Ob EVGA bei allen Geforce RTX 2060 KO auf einen TU104 setzt, wissen wir nicht - es bleibt außerdem offen, ob Nvidia den größeren Chip generell für Partner freigibt, damit sie diesen auf der Geforce RTX 2060 anstelle des TU106 verbauen können. Wir haben bei Nvidia diesbezüglich angefragt.

Spezifikationen der Turing-GPUs von Nvidia
TU102 TU104 TU106 TU116 TU117
Fertigung TSMC 12FFN TSMC 12FFN TSMC 12FFN TSMC 12FFN TSMC 12FFN
Die-Size 754 mm² 545 mm² 445 mm² 284 mm² 200 mm²
Transistoren 18,6 Milliarden 13,6 Milliarden 10,8 Milliarden 6,6 Milliarden 4,7 Milliarden
GPCs / TPCs / SMs 6 / 36 / 72 6 / 24 / 48 3 / 18 / 36 3 / 12 / 24 2 / 8 / 16
Shader-ALUs (FP32) 4.608 3.072 2.304 1.536 1.024
Textureinheiten 288 192 144 96 64
RT-Cores v1 72 48 36 /// ///
Tensor-Cores v2 576 384 288 /// ///
L2-Cache 6 MByte 4 MByte 4 MByte 1,5 MByte 1 MByte
Speicher-Interface 384 Bit 256 Bit 256 Bit 192 Bit 128 Bit
ROPs 96 64 64 48 36

Relevante Themen