Abo
  • Services:

Spezialeinheiten für AI und RT

Schon Pascal kann bestimmte Bereiche eines Frames in einer niedrigeren Auflösung rendern, was für Virtual Reality und hier vor allem mit Eye Tracking für Foveated Rendering interessant ist, da das menschliche Auge im Randbereich ein geringeres Auflösungsvermögen aufweist. Bei Turing erweitert Nvidia diesen Ansatz zum Content Adaptive Shading und zum Motion Adaptive Shading: Ersterer macht sich zunutze, dass bei manchen Flächen ein Farbwert für viele Pixel ausreicht und Letzteres, dass bei etwa Rennspielen schnell vorbeiziehende Objekte ohnehin weniger scharf wahrgenommen werden. In einer Demo mit Wolfenstein The New Colossus stieg durch dieses sogenannte Variable Rate Shading die Bildrate um 15 bis 20 Prozent.

Stellenmarkt
  1. Bundeskriminalamt, Wiesbaden
  2. HERMA GmbH, Filderstadt-Bonlanden

Ebenfalls neu ist Mesh Shading, was an AMDs Primitive Shader der Vega-GPUs erinnert: Szenen mit sehr hoher Objektanzahl und extrem viel Geometrie sind bei flüssigen Bildraten kaum möglich, da der Prozessor mit den Draw-Calls für die Grafikkarte nicht hinterher kommt. Daher erweitert Nvidia die Pipeline um zwei Stages, Task Shader und Mesh Shader, welche die Funktion der Vertex/Hull Shader und der Domain/Geometry Shader übernehmen. Durch eine Programmierung mit Listen und optimiertem LoD sollen mehr Polygone und feinere Tessellation möglich sein, sofern Entwickler den Mesh Shader implementieren. Randnotiz: Alle Turing-Chips unterstützen Direct3D Feature Level 12_1, neu ist Resource Binding Tier 3 statt Tier 2.

  • Turing folgt auf Pascal. (Bild: Nvidia)
  • Der TU102 fällt mit 754 mm² riesig aus. (Bild: Nvidia)
  • Dedizierte INT32-Einheiten sollen die Leistung verbessern. (Bild: Nvidia)
  • Turing hat größere und schnellere Caches. (Bild: Nvidia)
  • Die Shader-Einheiten sollen sehr viel flotter rechnen. (Bild: Nvidia)
  • Neben GDDR6 mit hohem Takt gibt es eine verbesserte Kompression. (Bild: Nvidia)
  • Der GDDR6 läuft mit 7 GHz oder 14 GBit/s. (Bild: Nvidia)
  • In jedem SM sitzen ein RT-Core und acht Tensor-Cores. (Bild: Nvidia)
  • Turing beschleunigt das Bounding Volume Hierachy für Raytracing. (Bild: Nvidia)
  • Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)
  • Der neue Mesh Shader soll mehr Geometrie ermöglichen. (Bild: Nvidia)
  • Die Pipeline wird um zwei neue Shader erweitert. (Bild: Nvidia)
  • Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)
  • Bei manchen Flächen muss nicht jeder Pixel neue, eigene Farbwerte erhalten. (Bild: Nvidia)
  • Die Geforce RTX haben HDMI, Displayport und Virtual Link. (Bild: Nvidia)
  • Besagte USB-C-Buchse ist für kommende VR-Headsets gedacht. (Bild: Nvidia)
  • Der NVENC kann H.265 in 8K mit 30 fps encodieren. (Bild: Nvidia)
  • DLSS nutzt Inferencing per Tensor-Cores. (Bild: Nvidia)
  • DLSS ist Upscaling, DLSS 2x ist eine Verbesserung der Bildqualität. (Bild: Nvidia)
  • TU102 und TU014 unterstützen NV-Link für SLI zweier Karten. (Bild: Nvidia)
Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)

Neben den regulärem ALUs rechnen in den Streaming Multiprocessor aber auch die bekannten Tensor-Cores und die neuen RT-Cores, womit in Spielen neue Möglichkeiten entstehen. Die Tensor-Cores berechnen Matrix-Multiplikationen mit FP16- oder INT8-Genauigkeit, was sie für Inferencing interessant macht. Nvidia hat das DLSS (Deep Learning Super Sampling) entwickelt: Auf einem Supercomputer werden tausende mit 64x SSAA gerenderte Bilder als Referenz verwendet, um ein neuronales Netz darauf zu trainieren, niedriger auflösende Frames auf möglichst identische Qualität zu interpolieren - sprich DLSS ist Upscaling mit Hilfe von AI. Eine andere Variante heißt DLSS 2x und nutzt die native statt eine reduzierte Auflösung um sie mit 64x SSAA abzugleichen, die Bildqualität steigt hierbei also.

Studios geben hierzu ihre Titel an Nvidia, das trainierte DNN wird dann per Treiber oder Patch ausgeliefert und DLSS per NGX-Schnittstelle (Neural Graphics Acceleration) auf den Tensor-Cores mit FP16 ausgeführt. Die DLSS-Kantenglättung soll durch halbierte Sample Rate viel Leistung bringen und dennoch gut aussehen, da Probleme temporaler Lösungen wie Ghosting oder Unschärfe vermieden werden; DLSS 2x wiederum ist ein optischer Gewinn. Zu den 25 angekündigten Titeln mit DLSS gehören Ark Survival Evolved, Final Fantasy 15, Hitman 2, Overkill's The Walking Dead, PUBG, Serious Sam 4 und Shadow of the Tomb Raider.

Die RT-Cores wiederum sind für Raytracing gedacht, können aber auch für räumlichen Sound in der Virtual Reality eingesetzt werden. Nvidia sendet über die ALUs die notwendigen Strahlen aus Perspektive der virtuellen Kamera aus, wobei bisherige Implementierungen einen für mehrere Pixel vorsehen. Die RT-Cores übernehmen die Bounding Volume Hierarchy, meist eine Baumstruktur vieler dreidimensionaler Würfel, um zu prüfen, wo ein Strahl ein Polygon trifft (Triangle Intersection), woraufhin die ALUs das Shading der Pixel übernehmen. Nvidia generiert nur primäre Strahlen, keine sekundären für Spiegelungen in Spiegelungen. Raytracing wird als Hybrid-Ansatz mit Raster-Grafik verwendet, etwa für eine globale Beleuchtung, für Partikel, für Reflexionen oder für Schatten. Weil das Resultat ziemlich grobkörnig ist, muss es entrauscht werden. Dieses Denoising erfolgt per Compute Shader in den regulären ALUs oder eben in den Tensor-Cores.

  • Turing folgt auf Pascal. (Bild: Nvidia)
  • Der TU102 fällt mit 754 mm² riesig aus. (Bild: Nvidia)
  • Dedizierte INT32-Einheiten sollen die Leistung verbessern. (Bild: Nvidia)
  • Turing hat größere und schnellere Caches. (Bild: Nvidia)
  • Die Shader-Einheiten sollen sehr viel flotter rechnen. (Bild: Nvidia)
  • Neben GDDR6 mit hohem Takt gibt es eine verbesserte Kompression. (Bild: Nvidia)
  • Der GDDR6 läuft mit 7 GHz oder 14 GBit/s. (Bild: Nvidia)
  • In jedem SM sitzen ein RT-Core und acht Tensor-Cores. (Bild: Nvidia)
  • Turing beschleunigt das Bounding Volume Hierachy für Raytracing. (Bild: Nvidia)
  • Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)
  • Der neue Mesh Shader soll mehr Geometrie ermöglichen. (Bild: Nvidia)
  • Die Pipeline wird um zwei neue Shader erweitert. (Bild: Nvidia)
  • Turing kann bestimmte Bildbereiche mit einer geringeren Shading-Rate berechnen. (Bild: Nvidia)
  • Bei manchen Flächen muss nicht jeder Pixel neue, eigene Farbwerte erhalten. (Bild: Nvidia)
  • Die Geforce RTX haben HDMI, Displayport und Virtual Link. (Bild: Nvidia)
  • Besagte USB-C-Buchse ist für kommende VR-Headsets gedacht. (Bild: Nvidia)
  • Der NVENC kann H.265 in 8K mit 30 fps encodieren. (Bild: Nvidia)
  • DLSS nutzt Inferencing per Tensor-Cores. (Bild: Nvidia)
  • DLSS ist Upscaling, DLSS 2x ist eine Verbesserung der Bildqualität. (Bild: Nvidia)
  • TU102 und TU014 unterstützen NV-Link für SLI zweier Karten. (Bild: Nvidia)
Die regulären Shader sind auch bei Raytracing involviert. (Bild: Nvidia)

Um Raytracing zu verwenden, müssen Entwickler es per Nvidias RTX implementieren. Unter Windows 10 v1809 setzt dieses auf Microsofts DXR auf, unter Vulkan gibt es passende Erweiterungen. Trotz RT-Cores und Raster-Hybrid erfordert Raytracing sehr viel Leistung, was wohl einer der Gründe ist, warum selbst der TU106 ein so großer Chip wurde. Das erste Spiel dürfte Battefield 5 im November 2018 sein, für das bereits erhältliche Shadow of the Tomb Raider folgt ein Patch. Weitere Titel sind Assetto Corsa Competizione von Kunos Simulazioni, Control von Remedy und Metro Exodus von 4A Games.

Erste Einschätzung

Nvidia selbst spricht von einer um 50 Prozent höheren Leistung, die eine Geforce RXT 2080 verglichen mit einer Geforce GTX 1080 erreichen soll. Die Pascal-Karte hat 2.560 Shader bei 1.733 MHz Boost und einer Speicherbandbreite von 320 GByte/s. Das neue Turing-Modell wiederum weist 2.944 ALUs (+15 %) mit 1.800 MHz Boost (+4 %) sowie 448 GByte/s (+40 %) auf, die Shader müssen also tatsächlich pro Takt viel schneller werden. Wir haben die Geforce RTX 2080 und die Geforce RTX 2080 Ti bereits im Testlabor und werden die Geschwindigkeit prüfen. Für Raytracing, Deep Learning Super Sampling und Co. braucht es aber noch ein paar Wochen, bis passende Patches oder Spiele verfügbar sind.

Offenlegung: Golem.de hat auf Einladung von Nvidia am Editor's Day in Köln teilgenommen, die Reisekosten wurden zur Gänze von Nvidia bezahlt. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

 Grafikkarten: Das kann Nvidias Turing-Architektur
  1.  
  2. 1
  3. 2


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de
  2. (reduzierte Überstände, Restposten & Co.)

Tuxgamer12 19. Sep 2018

Nvidia wird ja wohl kaum die krassen Firmengeheimnisse ausplaudern. Nur um das hier...

ms (Golem.de) 18. Sep 2018

Per NV-Link V2 halt, aber brauchst Software Support.

neocron 17. Sep 2018

1. war genau das auch nicht bestandteil dieser Diskussion hier, daher muss es daran auch...

nixidee 17. Sep 2018

Das ist eine reine Consumerkarte, du sollst damit zocken. Mit deiner 780 wirst du kein...

bombinho 17. Sep 2018

Raytracing selbst orientiert sich ja am Teilchencharakter von Licht. Die naechste Stufe...


Folgen Sie uns
       


Pathfinder Kingmaker - Golem.de live (Teil 2)

In Teil 2 unseres Livestreams wächst nicht nur unsere Party, sondern es gibt auch beim Endkampf jede Menge Drama, Wut und Liebe im Chat.

Pathfinder Kingmaker - Golem.de live (Teil 2) Video aufrufen
NGT Cargo: Der Güterzug der Zukunft fährt 400 km/h
NGT Cargo
Der Güterzug der Zukunft fährt 400 km/h

Güterzüge sind lange, laute Gebilde, die langsam durch die Lande zuckeln. Das soll sich ändern: Das DLR hat ein Konzept für einen automatisiert fahrenden Hochgeschwindigkeitsgüterzug entwickelt, der schneller ist als der schnellste ICE.
Ein Bericht von Werner Pluta


    Flexibles Smartphone: Samsung verspielt die Smartphone-Führung
    Flexibles Smartphone
    Samsung verspielt die Smartphone-Führung

    Jahrelang dominierte Samsung den Smartphone-Markt mit Innovationen, in den vergangenen Monaten verliert der südkoreanische Hersteller aber das Momentum. Krönung dieser Entwicklung ist das neue flexible Nicht-Smartphone - die Konkurrenz aus China dürfte feiern.
    Eine Analyse von Tobias Költzsch

    1. Flexibles Display Samsungs faltbares Smartphone soll im März 2019 erscheinen
    2. Samsung Linux-on-Dex startet in privater Beta
    3. Infinity Flex Samsung zeigt statt Smartphone nur faltbares Display

    Serverless Computing: Mehr Zeit für den Code
    Serverless Computing
    Mehr Zeit für den Code

    Weniger Verwaltungsaufwand und mehr Automatisierung: Viele Entwickler bauen auf fertige Komponenten aus der Cloud, um die eigenen Anwendungen aufzubauen. Beim Serverless Computing verschwinden die benötigten Server unter einer dicken Abstraktionsschicht, was mehr Zeit für den eigenen Code lässt.
    Von Valentin Höbel

    1. Kubernetes Cloud Discovery inventarisiert vergessene Cloud-Native-Apps
    2. T-Systems Deutsche Telekom will Cloud-Firmen kaufen
    3. Trotz hoher Gewinne Wieder Stellenabbau bei Microsoft

      •  /