Spezialeinheiten für AI und RT
Schon Pascal kann bestimmte Bereiche eines Frames in einer niedrigeren Auflösung rendern, was für Virtual Reality und hier vor allem mit Eye Tracking für Foveated Rendering interessant ist, da das menschliche Auge im Randbereich ein geringeres Auflösungsvermögen aufweist. Bei Turing erweitert Nvidia diesen Ansatz zum Content Adaptive Shading und zum Motion Adaptive Shading: Ersterer macht sich zunutze, dass bei manchen Flächen ein Farbwert für viele Pixel ausreicht und Letzteres, dass bei etwa Rennspielen schnell vorbeiziehende Objekte ohnehin weniger scharf wahrgenommen werden. In einer Demo mit Wolfenstein The New Colossus stieg durch dieses sogenannte Variable Rate Shading die Bildrate um 15 bis 20 Prozent.
Ebenfalls neu ist Mesh Shading, was an AMDs Primitive Shader der Vega-GPUs erinnert: Szenen mit sehr hoher Objektanzahl und extrem viel Geometrie sind bei flüssigen Bildraten kaum möglich, da der Prozessor mit den Draw-Calls für die Grafikkarte nicht hinterher kommt. Daher erweitert Nvidia die Pipeline um zwei Stages, Task Shader und Mesh Shader, welche die Funktion der Vertex/Hull Shader und der Domain/Geometry Shader übernehmen. Durch eine Programmierung mit Listen und optimiertem LoD sollen mehr Polygone und feinere Tessellation möglich sein, sofern Entwickler den Mesh Shader implementieren. Randnotiz: Alle Turing-Chips unterstützen Direct3D Feature Level 12_1, neu ist Resource Binding Tier 3 statt Tier 2.
Neben den regulärem ALUs rechnen in den Streaming Multiprocessor aber auch die bekannten Tensor-Cores und die neuen RT-Cores, womit in Spielen neue Möglichkeiten entstehen. Die Tensor-Cores berechnen Matrix-Multiplikationen mit FP16- oder INT8-Genauigkeit, was sie für Inferencing interessant macht. Nvidia hat das DLSS (Deep Learning Super Sampling) entwickelt: Auf einem Supercomputer werden tausende mit 64x SSAA gerenderte Bilder als Referenz verwendet, um ein neuronales Netz darauf zu trainieren, niedriger auflösende Frames auf möglichst identische Qualität zu interpolieren - sprich DLSS ist Upscaling mit Hilfe von AI. Eine andere Variante heißt DLSS 2x und nutzt die native statt eine reduzierte Auflösung um sie mit 64x SSAA abzugleichen, die Bildqualität steigt hierbei also.
Studios geben hierzu ihre Titel an Nvidia, das trainierte DNN wird dann per Treiber oder Patch ausgeliefert und DLSS per NGX-Schnittstelle (Neural Graphics Acceleration) auf den Tensor-Cores mit FP16 ausgeführt. Die DLSS-Kantenglättung soll durch halbierte Sample Rate viel Leistung bringen und dennoch gut aussehen, da Probleme temporaler Lösungen wie Ghosting oder Unschärfe vermieden werden; DLSS 2x wiederum ist ein optischer Gewinn. Zu den 25 angekündigten Titeln mit DLSS gehören Ark Survival Evolved, Final Fantasy 15, Hitman 2, Overkill's The Walking Dead, PUBG, Serious Sam 4 und Shadow of the Tomb Raider.
Die RT-Cores wiederum sind für Raytracing gedacht, können aber auch für räumlichen Sound in der Virtual Reality eingesetzt werden. Nvidia sendet über die ALUs die notwendigen Strahlen aus Perspektive der virtuellen Kamera aus, wobei bisherige Implementierungen einen für mehrere Pixel vorsehen. Die Shader-Einheiten erstellen eine Bounding Volume Hierarchy (BVH), eine Beschleunigungsstruktur, um zu prüfen, wo ein Strahl ein Polygon trifft. Genau dieses Durchlaufen der BVH und die Schnittpunktprüfung (Traversal & Intersection) erledigen die RT-Cores, woraufhin wiederum die ALUs das Shading der Pixel übernehmen. Nvidia generiert nur primäre Strahlen, keine sekundären für Spiegelungen in Spiegelungen. Raytracing wird als Hybrid-Ansatz mit Raster-Grafik verwendet, etwa für eine globale Beleuchtung, für Partikel, für Reflexionen oder für Schatten. Weil das Resultat ziemlich grobkörnig ist, muss es entrauscht werden. Dieses Denoising erfolgt üblicherweise per Compute Shader in den regulären ALUs oder (bei Offline-Rendering) in den Tensor-Cores.
Um Raytracing zu verwenden, müssen Entwickler es per Nvidias RTX implementieren. Unter Windows 10 v1809 setzt dieses auf Microsofts DXR auf, unter Vulkan gibt es passende Erweiterungen. Trotz RT-Cores und Raster-Hybrid erfordert Raytracing sehr viel Leistung, was wohl einer der Gründe ist, warum selbst der TU106 ein so großer Chip wurde. Das erste Spiel dürfte Battefield 5 im November 2018 sein, für das bereits erhältliche Shadow of the Tomb Raider folgt ein Patch. Weitere Titel sind Assetto Corsa Competizione von Kunos Simulazioni, Control von Remedy und Metro Exodus von 4A Games.
Erste Einschätzung
Nvidia selbst spricht von einer um 50 Prozent höheren Leistung, die eine Geforce RXT 2080 verglichen mit einer Geforce GTX 1080 erreichen soll. Die Pascal-Karte hat 2.560 Shader bei 1.733 MHz Boost und einer Speicherbandbreite von 320 GByte/s. Das neue Turing-Modell wiederum weist 2.944 ALUs (+15 %) mit 1.800 MHz Boost (+4 %) sowie 448 GByte/s (+40 %) auf, die Shader müssen also tatsächlich pro Takt viel schneller werden. Wir haben die Geforce RTX 2080 und die Geforce RTX 2080 Ti bereits im Testlabor und werden die Geschwindigkeit prüfen. Für Raytracing, Deep Learning Super Sampling und Co. braucht es aber noch ein paar Wochen, bis passende Patches oder Spiele verfügbar sind.
Offenlegung: Golem.de hat auf Einladung von Nvidia am Editor's Day in Köln teilgenommen, die Reisekosten wurden zur Gänze von Nvidia bezahlt. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Grafikkarten: Das kann Nvidias Turing-Architektur |
- 1
- 2
Nvidia wird ja wohl kaum die krassen Firmengeheimnisse ausplaudern. Nur um das hier...
Per NV-Link V2 halt, aber brauchst Software Support.
1. war genau das auch nicht bestandteil dieser Diskussion hier, daher muss es daran auch...
Das ist eine reine Consumerkarte, du sollst damit zocken. Mit deiner 780 wirst du kein...
Raytracing selbst orientiert sich ja am Teilchencharakter von Licht. Die naechste Stufe...