Turing ähnelt Volta stark
Nvidia bezeichnet Turing als den größten technologischen Sprung seit dem G80-Chip der legendären Geforce 8800 GTX, den damals ersten mit Unified-Shader und D3D10-Unterstützung. Verglichen mit den vorherigen Generationen Maxwell v2 und Pascal weist Turing definitiv gewaltige Unterschiede bei der Architektur auf. Eine längere theoretische Abhandlung zur Turing-Technik haben wir bereits online, daher hier die verkürzte Version mit einigen neuen Informationen, welche wir beim Testen erlangen konnten.
Bisher gibt es von Turing drei Chips - den TU102 (Geforce RTX 2080 Ti), den TU104 (Geforce RTX 2080) und den TU106 (Geforce RTX 2070). Sie alle werden vom Auftragsfertiger TSMC im 12FFN-Verfahren (12 nm FinFet Nvidia) hergestellt, einem optimierten 16+ Node. Auffällig ist die schiere Größe der Dies, selbst der TU106 fällt mit 445 mm² größer aus als der GP102 der Titan XP, der neben der Titan V bisher schnellsten Grafikkarte für Spieler. Ohnehin ist V wie Volta das Stichwort, denn Turing weist viele Parallelen zum GV100-Chip auf.
Denn in den TU-10x-Grafikprozessoren stecken neben klassischen Shader-Kernen noch zwei Arten von Spezialeinheiten für Raytracing und Deep Learning. Aber der Reihe nach: Turing implementiert ein überarbeitetes Cache-System mit einem neuen L0-Puffer für Instruktionen und einer größeren L1-Stufe sowie verdoppeltem L2-Cache. Hinzu kommt ein geänderter Aufbau der Shader-Cluster, die nun flexiber mit Daten versorgt werden und mehr Register-Speicher haben. Beispielsweise gibt es nun neben den FP32- auch dedizierte INT32-Rechenwerke, was die Auslastung der Shader laut Nvidia durchschnittlich um mehr als ein Drittel verbessern soll. Neu ist zudem der GDDR6-Speichercontroller mit optimierter verlustfreier Kompression, welcher höhere Taktraten und feinkörnigere Übertragung von Informationen als noch bei GDDR5(X) möglich macht.
Nvidia spricht intern von SM_75, was ein Fortschritt zu SM_70 von Volta ist. Verglichen mit den Shader-Einheiten von Pascal sollen die ALUs bei Turing rund 50 Prozent schneller rechnen. Das ist jedoch der Bestfall und nicht die Regel. Dafür gibt es mit den RT-Cores dedizierte Einheiten für Raytracing, konkret verfolgen diese die Strahlen nach und prüfen, wo ein Polygon getroffen wird, damit die Shader dann die Pixel bearbeiten können. Raytracing wird für realistischere Reflexionen, Schatten oder die Beleuchtung in kommenden Spielen eingesetzt. Titel wie Shadow of the Tomb Raider erhalten Patches, überdies ist Windows 10 v1809 notwendig, welches im Oktober 2018 erscheint. Wenigstens für die nächsten Wochen liegt das Raytracing der Geforce RTX daher brach.
Ebenfalls neu sind die Tensor-Cores v2, also verbesserte Kerne verglichen mit Volta. Sie beherrschen neben FP16-Akkumulierung auch reine FP16-Berechnungen mit sehr hoher Geschwindigkeit und arbeiten optional mit doppelter INT8- oder vierfacher INT4-Datenrate ausgehend von FP16. Die Tensor-Cores eignen sich zum Entrauschen bei der Raytracing-Darstellung oder für eine von Nvidia als DLSS (Deep Learning Super Sampling) bezeichnete Kantenglättung. Für die liegt uns zwar eine Demo von Final Fantasy 15 vor, es blieb aber keine Zeit, sich diese in Ruhe und im Detail anzuschauen.
TU102 | TU104 | TU106 | TU116 | TU117 | |
---|---|---|---|---|---|
Fertigung | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN |
Die-Size | 754 mm² | 545 mm² | 445 mm² | 284 mm² | 200 mm² |
Transistoren | 18,6 Milliarden | 13,6 Milliarden | 10,8 Milliarden | 6,6 Milliarden | 4,7 Milliarden |
GPCs / TPCs / SMs | 6 / 36 / 72 | 6 / 24 / 48 | 3 / 18 / 36 | 3 / 12 / 24 | 2 / 8 / 16 |
Shader-ALUs (FP32) | 4.608 | 3.072 | 2.304 | 1.536 | 1.024 |
Textureinheiten | 288 | 192 | 144 | 96 | 64 |
RT-Cores v1 | 72 | 48 | 36 | /// | /// |
Tensor-Cores v2 | 576 | 384 | 288 | /// | /// |
L2-Cache | 6 MByte | 4 MByte | 4 MByte | 1,5 MByte | 1 MByte |
Speicher-Interface | 384 Bit | 256 Bit | 256 Bit | 192 Bit | 128 Bit |
ROPs | 96 | 64 | 64 | 48 | 36 |
Abschließend noch ein paar Worte zum NVENC (Nvidia Encoder): Der kann nun H.265 sowie VP9 in 4K mit 12 Bit samt HDR decodieren und H.265 mit 8K und HDR bei 30 fps encodieren. Weiterhin will der Hersteller die generelle Qualität verbessert haben. Bei gleicher Bitrate sei das Signal-Rausch-Verhältnis mit Turing besser als per x264 Fast auf der CPU - das ist wichtig für Streamer, etwa bei Twitch.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Geforce RTX 2080 (Ti) im Test: Nvidias Turing-Grafikkarten sind konkurrenzlos | Die Geforce RTX im Detail |
nein genau das ist sehr unwahrscheinlich. Turing gibt es nur bis zur 2070.... Wenn...
Zu den 4ms kommen meist noch zwischen 20 und 100ms fuer die Elektronik. Wenn Du fuer...
Vielen Dank. Die Diagramme habe ich tatsächlich nur überflogen. Eine Nachbesserung per...
Das wäre Marketing, welches den Kunden über Jahrzehnte binden würde. Eine Karte Sie zu...
Das Problem ist, dass die Raytracingspezifikationen erst Ende Juli an die...