Abo
  • Services:

Spezialeinheiten für AI und RT

Schon Pascal kann bestimmte Bereiche eines Frames in einer niedrigeren Auflösung rendern, was für Virtual Reality und hier vor allem mit Eye Tracking für Foveated Rendering interessant ist, da das menschliche Auge im Randbereich ein geringeres Auflösungsvermögen aufweist. Bei Turing erweitert Nvidia diesen Ansatz zum Content Adaptive Shading und zum Motion Adaptive Shading: Ersterer macht sich zunutze, dass bei manchen Flächen ein Farbwert für viele Pixel ausreicht und Letzteres, dass bei etwa Rennspielen schnell vorbeiziehende Objekte ohnehin weniger scharf wahrgenommen werden. In einer Demo mit Wolfenstein The New Colossus stieg durch dieses sogenannte Variable Rate Shading die Bildrate um 15 bis 20 Prozent.

Stellenmarkt
  1. August Beck GmbH & Co. KG, Winterlingen
  2. ING-DiBa AG, Nürnberg, Frankfurt

Ebenfalls neu ist Mesh Shading, was an AMDs Primitive Shader der Vega-GPUs erinnert: Szenen mit sehr hoher Objektanzahl und extrem viel Geometrie sind bei flüssigen Bildraten kaum möglich, da der Prozessor mit den Draw-Calls für die Grafikkarte nicht hinterher kommt. Daher erweitert Nvidia die Pipeline um zwei Stages, Task Shader und Mesh Shader, welche die Funktion der Vertex/Hull Shader und der Domain/Geometry Shader übernehmen. Durch eine Programmierung mit Listen und optimiertem LoD sollen mehr Polygone und feinere Tessellation möglich sein, sofern Entwickler den Mesh Shader implementieren. Randnotiz: Alle Turing-Chips unterstützen Direct3D Feature Level 12_1, neu ist Resource Binding Tier 3 statt Tier 2.

  • Turing folgt auf Pascal. (Bild: Nvidia)
  • Der TU102 fällt mit 754 mm² riesig aus. (Bild: Nvidia)
  • Dedizierte INT32-Einheiten sollen die Leistung verbessern. (Bild: Nvidia)
  • Turing hat größere und schnellere Caches. (Bild: Nvidia)
  • Die Shader-Einheiten sollen sehr viel flotter rechnen. (Bild: Nvidia)
  • Neben GDDR6 mit hohem Takt gibt es eine verbesserte Kompression. (Bild: Nvidia)
  • Der GDDR6 läuft mit 7 GHz oder 14 GBit/s. (Bild: Nvidia)
  • In jedem SM sitzen ein RT-Core und acht Tensor-Cores. (Bild: Nvidia)
  • Turing beschleunigt das Bounding Volume Hierachy für Raytracing. (Bild: Nvidia)
  • Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)
  • Der neue Mesh Shader soll mehr Geometrie ermöglichen. (Bild: Nvidia)
  • Die Pipeline wird um zwei neue Shader erweitert. (Bild: Nvidia)
  • Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)
  • Bei manchen Flächen muss nicht jeder Pixel neue, eigene Farbwerte erhalten. (Bild: Nvidia)
  • Die Geforce RTX haben HDMI, Displayport und Virtual Link. (Bild: Nvidia)
  • Besagte USB-C-Buchse ist für kommende VR-Headsets gedacht. (Bild: Nvidia)
  • Der NVENC kann H.265 in 8K mit 30 fps encodieren. (Bild: Nvidia)
  • DLSS nutzt Inferencing per Tensor-Cores. (Bild: Nvidia)
  • DLSS ist Upscaling, DLSS 2x ist eine Verbesserung der Bildqualität. (Bild: Nvidia)
  • TU102 und TU014 unterstützen NV-Link für SLI zweier Karten. (Bild: Nvidia)
Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)

Neben den regulärem ALUs rechnen in den Streaming Multiprocessor aber auch die bekannten Tensor-Cores und die neuen RT-Cores, womit in Spielen neue Möglichkeiten entstehen. Die Tensor-Cores berechnen Matrix-Multiplikationen mit FP16- oder INT8-Genauigkeit, was sie für Inferencing interessant macht. Nvidia hat das DLSS (Deep Learning Super Sampling) entwickelt: Auf einem Supercomputer werden tausende mit 64x SSAA gerenderte Bilder als Referenz verwendet, um ein neuronales Netz darauf zu trainieren, niedriger auflösende Frames auf möglichst identische Qualität zu interpolieren - sprich DLSS ist Upscaling mit Hilfe von AI. Eine andere Variante heißt DLSS 2x und nutzt die native statt eine reduzierte Auflösung um sie mit 64x SSAA abzugleichen, die Bildqualität steigt hierbei also.

Studios geben hierzu ihre Titel an Nvidia, das trainierte DNN wird dann per Treiber oder Patch ausgeliefert und DLSS per NGX-Schnittstelle (Neural Graphics Acceleration) auf den Tensor-Cores mit FP16 ausgeführt. Die DLSS-Kantenglättung soll durch halbierte Sample Rate viel Leistung bringen und dennoch gut aussehen, da Probleme temporaler Lösungen wie Ghosting oder Unschärfe vermieden werden; DLSS 2x wiederum ist ein optischer Gewinn. Zu den 25 angekündigten Titeln mit DLSS gehören Ark Survival Evolved, Final Fantasy 15, Hitman 2, Overkill's The Walking Dead, PUBG, Serious Sam 4 und Shadow of the Tomb Raider.

Die RT-Cores wiederum sind für Raytracing gedacht, können aber auch für räumlichen Sound in der Virtual Reality eingesetzt werden. Nvidia sendet über die ALUs die notwendigen Strahlen aus Perspektive der virtuellen Kamera aus, wobei bisherige Implementierungen einen für mehrere Pixel vorsehen. Die RT-Cores übernehmen die Bounding Volume Hierarchy, meist eine Baumstruktur vieler dreidimensionaler Würfel, um zu prüfen, wo ein Strahl ein Polygon trifft (Triangle Intersection), woraufhin die ALUs das Shading der Pixel übernehmen. Nvidia generiert nur primäre Strahlen, keine sekundären für Spiegelungen in Spiegelungen. Raytracing wird als Hybrid-Ansatz mit Raster-Grafik verwendet, etwa für eine globale Beleuchtung, für Partikel, für Reflexionen oder für Schatten. Weil das Resultat ziemlich grobkörnig ist, muss es entrauscht werden. Dieses Denoising erfolgt per Compute Shader in den regulären ALUs oder eben in den Tensor-Cores.

  • Turing folgt auf Pascal. (Bild: Nvidia)
  • Der TU102 fällt mit 754 mm² riesig aus. (Bild: Nvidia)
  • Dedizierte INT32-Einheiten sollen die Leistung verbessern. (Bild: Nvidia)
  • Turing hat größere und schnellere Caches. (Bild: Nvidia)
  • Die Shader-Einheiten sollen sehr viel flotter rechnen. (Bild: Nvidia)
  • Neben GDDR6 mit hohem Takt gibt es eine verbesserte Kompression. (Bild: Nvidia)
  • Der GDDR6 läuft mit 7 GHz oder 14 GBit/s. (Bild: Nvidia)
  • In jedem SM sitzen ein RT-Core und acht Tensor-Cores. (Bild: Nvidia)
  • Turing beschleunigt das Bounding Volume Hierachy für Raytracing. (Bild: Nvidia)
  • Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)
  • Der neue Mesh Shader soll mehr Geometrie ermöglichen. (Bild: Nvidia)
  • Die Pipeline wird um zwei neue Shader erweitert. (Bild: Nvidia)
  • Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)
  • Bei manchen Flächen muss nicht jeder Pixel neue, eigene Farbwerte erhalten. (Bild: Nvidia)
  • Die Geforce RTX haben HDMI, Displayport und Virtual Link. (Bild: Nvidia)
  • Besagte USB-C-Buchse ist für kommende VR-Headsets gedacht. (Bild: Nvidia)
  • Der NVENC kann H.265 in 8K mit 30 fps encodieren. (Bild: Nvidia)
  • DLSS nutzt Inferencing per Tensor-Cores. (Bild: Nvidia)
  • DLSS ist Upscaling, DLSS 2x ist eine Verbesserung der Bildqualität. (Bild: Nvidia)
  • TU102 und TU014 unterstützen NV-Link für SLI zweier Karten. (Bild: Nvidia)
Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)

Um Raytracing zu verwenden, müssen Entwickler es per Nvidias RTX implementieren. Unter Windows 10 v1809 setzt dieses auf Microsofts DXR auf, unter Vulkan gibt es passende Erweiterungen. Trotz RT-Cores und Raster-Hybrid erfordert Raytracing sehr viel Leistung, was wohl einer der Gründe ist, warum selbst der TU106 ein so großer Chip wurde. Das erste Spiel dürfte Battefield 5 im November 2018 sein, für das bereits erhältliche Shadow of the Tomb Raider folgt ein Patch. Weitere Titel sind Assetto Corsa Competizione von Kunos Simulazioni, Control von Remedy und Metro Exodus von 4A Games.

Erste Einschätzung

Nvidia selbst spricht von einer um 50 Prozent höheren Leistung, die eine Geforce RXT 2080 verglichen mit einer Geforce GTX 1080 erreichen soll. Die Pascal-Karte hat 2.560 Shader bei 1.733 MHz Boost und einer Speicherbandbreite von 320 GByte/s. Das neue Turing-Modell wiederum weist 2.944 ALUs (+15 %) mit 1.800 MHz Boost (+4 %) sowie 448 GByte/s (+40 %) auf, die Shader müssen also tatsächlich pro Takt viel schneller werden. Wir haben die Geforce RTX 2080 und die Geforce RTX 2080 Ti bereits im Testlabor und werden die Geschwindigkeit prüfen. Für Raytracing, Deep Learning Super Sampling und Co. braucht es aber noch ein paar Wochen, bis passende Patches oder Spiele verfügbar sind.

Offenlegung: Golem.de hat auf Einladung von Nvidia am Editor's Day in Köln teilgenommen, die Reisekosten wurden zur Gänze von Nvidia bezahlt. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

 Grafikkarten: Das kann Nvidias Turing-Architektur
  1.  
  2. 1
  3. 2


Anzeige
Blu-ray-Angebote
  1. 34,99€

Tuxgamer12 19. Sep 2018 / Themenstart

Nvidia wird ja wohl kaum die krassen Firmengeheimnisse ausplaudern. Nur um das hier...

ms (Golem.de) 18. Sep 2018 / Themenstart

Per NV-Link V2 halt, aber brauchst Software Support.

neocron 17. Sep 2018 / Themenstart

1. war genau das auch nicht bestandteil dieser Diskussion hier, daher muss es daran auch...

nixidee 17. Sep 2018 / Themenstart

Das ist eine reine Consumerkarte, du sollst damit zocken. Mit deiner 780 wirst du kein...

bombinho 17. Sep 2018 / Themenstart

Raytracing selbst orientiert sich ja am Teilchencharakter von Licht. Die naechste Stufe...

Kommentieren


Folgen Sie uns
       


Two Point Hospital - Golem.de live

Dr. Dr. Golem meldet sich zum Dienst und muss im Livestream unfassbar viele depressive Clowns heilen, nein - nicht die im Chat.

Two Point Hospital - Golem.de live Video aufrufen
Amazon Alexa: Echo Sub verhilft Echo-Lautsprechern zu mehr Bass
Amazon Alexa
Echo Sub verhilft Echo-Lautsprechern zu mehr Bass

Amazon hat einen Subwoofer speziell für Echo-Lautsprecher vorgestellt. Damit sollen die eher bassarmen Lautsprecher mit einem ordentlichen Tiefbass ausgestattet werden. Zudem öffnet Amazon seine Multiroom-Musikfunktion für Alexa-Lautsprecher anderer Hersteller.

  1. Beosound 2 Bang & Olufsen bringt smarten Lautsprecher für 2.000 Euro
  2. Google und Amazon Markt für smarte Lautsprecher wächst weiter stark
  3. Alexa-Soundbars im Test Sonos' Beam und Polks Command Bar sind die Klangreferenz

Elektroroller-Verleih Coup: Zum Laden in den Keller gehen
Elektroroller-Verleih Coup
Zum Laden in den Keller gehen

Wie hält man eine Flotte mit 1.000 elektrischen Rollern am Laufen? Die Bosch-Tochter Coup hat in Berlin einen Blick hinter die Kulissen der Sharing-Wirtschaft gewährt.
Ein Bericht von Friedhelm Greis

  1. Neue Technik Bosch verkündet Durchbruch für saubereren Diesel
  2. Halbleiterwerk Bosch beginnt Bau neuer 300-mm-Fab in Dresden
  3. Zu hohe Investionen Bosch baut keine eigenen Batteriezellen

iOS 12 im Test: Auch Apple will es Nutzern leichter machen
iOS 12 im Test
Auch Apple will es Nutzern leichter machen

Apple setzt mit iOS 12 weniger auf aufsehenerregende Funktionen als auf viele kleine Verbesserungen für den Alltag. Das erinnert an Google und Android 9, was nicht zwingend schlecht ist.
Ein Test von Tobias Költzsch

  1. Apple iOS 12.1 verrät neues iPad Pro
  2. Apple Siri-Kurzbefehle-App für iOS 12 verfügbar

    •  /