Async Compute und Virtual Reality

Zu den Neuerungen der Pascal-Architektur zählen laut Nvidia eine verbesserte Implementierung von Async Compute und die sogenannte Simultaneous Multi-Projection. Bei Maxwell musste für Async Compute unter Direct3D 11 noch ein Context Switch am Ende eines Draw-Calls erfolgen, was eine zeitaufwendige Neuzuteilung von Compute oder Graphics für den jeweiligen SM erzwingt. Ein aktuelles Beispiel ist der Timewarp, mit dem bei Virtual Reality ein bereits fertiger Frame mit neuen Rotationspositionsdaten versehen wird.

  • Blockdiagramm des GP104 (Bild: Nvidia)
  • Diagramm eines Shader-Processors (Bild: Nvidia)
  • Die Geforce GTX 1080 nutzt GDDR5X. (Bild: Nvidia)
  • Nvidia hat die Kompression verbessert. (Bild: Nvidia)
  • Als Beispiel dient Project Cars. (Bild: Nvidia)
  • Maxwell-Kompression (Bild: Nvidia)
  • Pascal-Kompression (Bild: Nvidia)
  • Resultate in diversen Spielen (Bild: Nvidia)
  • Simultaneous Multi-Projection steigert die VR-Leistung. (Bild: Nvidia)
  • Async Compute läuft nun schneller. (Bild: Nvidia)
  • Ein Grund ist die bessere Pre-Emption. (Bild: Nvidia)
  • Platine der Geforce GTX 1080 (Bild: Techpowerup)
  • Leistungsaufnahme der Geforce GTX 1080 (Bild: Tom's Hardware)
  • Leistungsaufnahme der Geforce GTX 980 (Bild: Tom's Hardware)
  • Die GTX 1080 ist die schnellste Grafikkarte. (Bild: Nvidia)
Async Compute läuft nun schneller. (Bild: Nvidia)

Zwar soll Pascal anders als AMDs derzeitige GCN-v3-Technik einen Context Switch nicht ohne Pre-Emption erledigen können, dafür aber anders als Maxwell dynamisch zur Laufzeit auf Pixel-Level- sowie später auch auf Instruktion-Ebene. Laufende Berechnungen werden gestoppt, die bisherigen Resultate gesichert und dann die priorisierte Aufgabe eingeschoben. Zudem soll Pascal als momentan einzige Architektur auch eine Pre-Emption für Graphics- und nicht nur für Compute-Workloads beherrschen. Die Benchmarks der Computerbase mit dem Direct3D-12-Spiel Ashes of the Singularity untermauern Nvidias Aussage: Da Async Compute per Ini-Datei umschaltbar ist, fällt ein Vergleich theoretisch leicht. Laut Oxide Games ist die Funktion aber bei allen Nvidia-Karte selbst bei passendem Ini-Eintrag schlicht deaktiviert.

Abseits klassischer Spiele hat die Simultaneous Multi-Projection für Virtual Reality angekündigt, was eine Funktion der überarbeiteten Polymorph-Engines ist. Maxwell-Grafikkarten können bis zu neun Viewports gleichzeitig rendern, was Nvidia für Multi-Res Shading nutzt. Bei Pascal-Modellen sind es 16 Stück, zudem kann einmal gerenderte Geometrie auf zwei Ausgangspunkte auf der X-Achse skalieren, was in 32 Projektionen resultiert. Das Verfahren ist vor allem für Virtual Reality interessant, muss aber von den jeweiligen Entwicklern per SDK ins Spiel implementiert werden, damit SMP verfügbar ist.

  • Blockdiagramm des GP104 (Bild: Nvidia)
  • Diagramm eines Shader-Processors (Bild: Nvidia)
  • Die Geforce GTX 1080 nutzt GDDR5X. (Bild: Nvidia)
  • Nvidia hat die Kompression verbessert. (Bild: Nvidia)
  • Als Beispiel dient Project Cars. (Bild: Nvidia)
  • Maxwell-Kompression (Bild: Nvidia)
  • Pascal-Kompression (Bild: Nvidia)
  • Resultate in diversen Spielen (Bild: Nvidia)
  • Simultaneous Multi-Projection steigert die VR-Leistung. (Bild: Nvidia)
  • Async Compute läuft nun schneller. (Bild: Nvidia)
  • Ein Grund ist die bessere Pre-Emption. (Bild: Nvidia)
  • Platine der Geforce GTX 1080 (Bild: Techpowerup)
  • Leistungsaufnahme der Geforce GTX 1080 (Bild: Tom's Hardware)
  • Leistungsaufnahme der Geforce GTX 980 (Bild: Tom's Hardware)
  • Die GTX 1080 ist die schnellste Grafikkarte. (Bild: Nvidia)
Simultaneous Multi-Projection steigert die VR-Leistung. (Bild: Nvidia)

Nvidia spricht in diesem Fall von Single Pass Stereo, also einem Rechendurchgang für beide Augen zusammen. Das spart viel Zeit bei der Erstellung der Geometrie-Daten, aber auch beim Treiber-Overhead. Als weitere Idee für Virtual Reality nennt der Hersteller eine Technik namens Lens Matched Shading: Bei einem VR-Headset muss die Darstellung gekrümmt erfolgen, um die Verzerrungen durch die Linsen wieder auszugleichen.

Während bei Multi-Res Shading die später gequetschten Außenbereiche in einer niedrigeren Auflösung gerendert werden, verwirft Lens Matched Shading von Anfang an ohnehin nicht benötigte Pixel. Der Rechenaufwand pro Frame verringert sich dadurch signifikant, hinzu kommt der Leistungszuwachs durch die Simultaneous Multi-Projection. Im Idealfall sollen beide Methoden zusammen die Geschwindigkeit von VR-Anwendungen verdoppeln.

Ebenfalls neu ist die verbesserte Codec-Unterstützung für Videos: Der NVENC des GP104-Chips kann H.265 mit 12 Bit decodieren sowie mit 10 Bit encodieren und VP9 in Hardware bei bis zu 4K-DCI bei 120 Hz decodieren. Microsofts Play Ready 3.0, ein Hardware-DRM, wird unterstützt. Um das hochauflösende Videomaterial darzustellen, verbaut Nvidia einen HDMI-2.0b-Ausgang, zwei Displayports 1.4 und ein Dual-Link-DVI. Passend dazu kündigte Nvidia an, dass bald Spiele mit High-Dynamic-Range-Ausgabe für entsprechende Fernseher verfügbar sein sollen, etwa Lawbreakers oder Rise of the Tomb Raider per Patch.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Boost v3, FinFET und GDDR5XKlar schneller als eine Titan X 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


PiranhA 28. Mai 2016

FYI, die 1080 GTX kann man aktuell für 670 Euro vorbestellen. Also gar nicht so viel...

nachgefragt 19. Mai 2016

bei neuen spielen ist man schon froh wenn flüssige 30-60fps ankommen :>

sfe (Golem.de) 19. Mai 2016

Bevor das hier noch weiter ausartet: closed. Sebastian Fels (golem.de)

alex-it 19. Mai 2016

Auf jeden Fall direkt bei nvidia wenn ich das richtig gelesen hatte. Man kann sich auf...



Aktuell auf der Startseite von Golem.de
CS GO mit Source 2
Das ist Valves Counter-Strike 2

Es ist offiziell: Valve stellt Counter-Strike 2 vor. Die Source-2-Engine bringt neues Gameplay und soll klassische Tickraten loswerden.

CS GO mit Source 2: Das ist Valves Counter-Strike 2
Artikel
  1. Akkutechnik: 4695-Akku schafft 40 Prozent mehr Reichweite als Tesla
    Akkutechnik
    4695-Akku schafft 40 Prozent mehr Reichweite als Tesla

    Mit herkömmlichen Fertigungsmethoden und nur 15 mm mehr Höhe baut Akkuhersteller EVE Zellen für BMW, die Teslas 4680 weit überlegen sind.

  2. Autodesign: Hyundai schwört auf physische Knöpfe und Regler
    Autodesign
    Hyundai schwört auf physische Knöpfe und Regler

    Bei Autos gibt es oft Soft-Touch-Buttons, um Kosten zu sparen, doch Hyundai findet das zu gefährlich und setzt weiter auf echte Knöpfe und Regler.

  3. Zoom, Teams, Jitsi: Videokonferenzsysteme datenschutzkonform nutzen
    Zoom, Teams, Jitsi
    Videokonferenzsysteme datenschutzkonform nutzen

    Datenschutz für Sysadmins Gerade die beliebten US-Anbieter sind bei Datenschutzbehörden gar nicht beliebt. Wir erläutern die Anforderungen an Videokonferenzsysteme.
    Ein Bericht von Friedhelm Greis

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Heute besonders viele MindStar-Tagesdeals • Gigabyte RTX 4070 Ti 880,56€ • Crucial SSD 2TB (PS5) 162,90€ • Nintendo Switch inkl. Spiel & Goodie 288€ • NBB Black Weeks: Rabatte bis 60% • PS5 + Resident Evil 4 Remake 569€ • LG OLED TV -57% • Amazon Coupon-Party [Werbung]
    •  /