RDNA2: Ray Accelerator & DX12

So wird zwar die Beschleunigungsstruktur (Bounding Volume Hierarchy, BVH) für die Geometrie der Szene per Compute Shader in den regulären Shadern erstellt, danach hören die Gemeinsamkeiten aber auf: Bei Nvidia liegt die BVH im GDDR6(X)-Speicher, bei AMD größtenteils im Infinity Cache. Der weist eine höhere Transfer-Rate und eine kürzere Zugriffszeit auf, was bei der ständig zu aktualisierenden Beschleunigungsstruktur die Verarbeitungsgeschwindigkeit steigert.

Stellenmarkt
  1. Senior Network Security Engineer - Produktionsnetzwerke (m/w/d)
    Schaeffler Technologies AG & Co. KG, Herzogenaurach
  2. (Senior) Cloud Developer (m/w/d)
    AUSY Technologies Germany AG, verschiedene Standorte
Detailsuche

Die BVH ist eine Baumstruktur aus verschachtelten Boxen, die immer kleiner werden und die Dreiecke für die Geometrie enthalten. Bei Nvidia erfolgt das Durchlaufen (Traversal) mithilfe der RT-Cores, bei AMD durch Compute Shader und mit Unterstützung des Infinity Cache. Erst bei der Schnittpunktprüfung, also der Prüfung, ob ein Strahl eine Box respektive ein Dreieck trifft oder nicht (Intersection), springen die Ray Accelerators ein. Das Shading übernehmen dann wieder die ALUs.

Laut AMD kann ein Ray Accelerator vier Boxen oder ein Dreieck pro Takt prüfen, Nvidia macht keine Angabe. Ohnehin wäre eine solche nicht vergleichbar, da die Implementierungen der Hersteller sich unterscheiden, was den Flächenbedarf im Chip und die finale Performance anbelangt. AMD wie Nvidia erfüllen die Anforderungen für eine Hardware-Beschleunigung von Khronos Groups "VK_KHR_ray_tracing" mit der Vulkan-Schnittstelle und für Microsofts DirectX Raytracing (DXR) via D3D12 unter Windows 10.

  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • RDNA2 taktet höher als RDNA1. (Bild: AMD)
  • Ungeachtet dessen steigt die Effizienz. (Bild: AMD)
  • Statt 384 Bit gibt es den Infinity Cache. (Bild: AMD)
  • Der liefert eine weitaus höhere Bandbreite als GDDR6 ... (Bild: AMD)
  • ... bei einer durchschnittlich niedrigeren Latenz. (Bild: AMD)
  • Der Infinity Cache taktet dynamisch zugunsten der Effizienz. (Bild: AMD)
  • Auch die anderes Caches wurden überarbeitet, etwa der L2. (Bild: AMD)
  • Jede Compute Unit umfasst einen Ray Accelerator zur Schnittpunktprüfung. (Bild: AMD)
  • Navi 21 unterstützt DirectX 12 Ultimate. (Bild: AMD)
  • Formate wie INT8 sind für Super Resolution wichtig. (Bild: AMD)
Jede Compute Unit umfasst einen Ray Accelerator zur Schnittpunktprüfung. (Bild: AMD)

Genau genommen unterstützt die RDNA2-Technik von Navi 21 das Direct3D Feature Level 12_2 und somit auch DirectX 12 Ultimate, genauso wie Nvidias Ampere-Architektur der Geforce RTX 3000. Unter das Feature Level 12_2 fallen das DirectX Raytracing (DXR) Tier 1.1 für schnelleres Raytracing und das Variable Rate Shading für eine höhere Bildrate bei möglichst geringem optischen Qualitätsverlust.

Golem Akademie
  1. First Response auf Security Incidents: Ein-Tages-Workshop
    14.11.2022, Virtuell
  2. Blender Grundkurs: virtueller Drei-Tage-Workshop
    07.-09.06.2022, Virtuell
Weitere IT-Trainings

Außerdem gibt es noch den Mesh Shader für mehr Geometrie pro Frame, bei dem, statt einzelne ALUs mit Vertex-Shading zu beschäftigen, ganze Thread-Gruppen ähnlich wie bei einem Compute Shader ausgelastet werden. Das Sampler Feedback für ein besseres Streaming mit scharfen statt verwaschenen Texturen sowie weniger Popups wiederum gibt Entwicklern mehr Kontrolle über die einzelnen Mip-Map-Stufen. Auch Directstorage für kürzere Ladezeiten und schönere Grafik soll von Navi 21 künftig unterstützt werden.

AMD-Grafikkarten bei Alternate
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • RDNA2 taktet höher als RDNA1. (Bild: AMD)
  • Ungeachtet dessen steigt die Effizienz. (Bild: AMD)
  • Statt 384 Bit gibt es den Infinity Cache. (Bild: AMD)
  • Der liefert eine weitaus höhere Bandbreite als GDDR6 ... (Bild: AMD)
  • ... bei einer durchschnittlich niedrigeren Latenz. (Bild: AMD)
  • Der Infinity Cache taktet dynamisch zugunsten der Effizienz. (Bild: AMD)
  • Auch die anderes Caches wurden überarbeitet, etwa der L2. (Bild: AMD)
  • Jede Compute Unit umfasst einen Ray Accelerator zur Schnittpunktprüfung. (Bild: AMD)
  • Navi 21 unterstützt DirectX 12 Ultimate. (Bild: AMD)
  • Formate wie INT8 sind für Super Resolution wichtig. (Bild: AMD)
Navi 21 unterstützt DirectX 12 Ultimate. (Bild: AMD)

Wichtig für Anwendungen und Spiele sind außerdem schnellere Formate: Die RDNA2-Technik kann FP16-Operationen mit doppelter FP32-Geschwindigkeit ausführen, so wie RDNA1. Neu sind INT8- und INT4-Berechnungen mit vier- sowie achtfacher FP32-Rate, wie sie für Inferencing eingesetzt werden. Folgerichtig arbeitet AMD an einem KI-Upscaling per künstlicher Intelligenz, vorläufig wird das als FidelityFX Super Resolution (FSR) bezeichnet. Das Pendant zum Rekonstruktionsfilter DLSS 2.0 (Deep Learning Super Sampling) von Nvidia braucht aber noch einige Zeit, einen Termin nannte AMD bisher nicht.

Bereits fertig ist die Hardware zur Video-Beschleunigung via VCN (Video Core Next): Navi 21 unterstützt das Decoding von AV1-Inhalten mit 8K30, hier zieht AMD also mit Nvidias Ampere-Chips gleich. Beim H.265-Encoding erfolgte der Schritt von 4K60 zu 8K30, was sich auch in den Monitor-Ausgängen widerspiegelt: Die Radeon RX 6800 XT hat einen HDMI 2.1, um 4K120- oder 8K60-Bildschirme anzubinden, hinzu kommen zwei Displayport 1.4 und eine USB-C-Buchse (Displayport-1.4-Alternate-Mode, USB 3.2 Gen2, Power Delivery mit 27 Watt).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 RDNA2: To Infinity and Beyond!Bei Raster-Grafik auf Geforce-Niveau 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10.  


yumiko 23. Nov 2020

Kuriosität wäre eien gute Voraussetzung für einen ausführlichen Technik Artikel ^^ Für...

ms (Golem.de) 20. Nov 2020

Das ist schlicht AMDs eigene Bezeichnung für Resizable BAR Support, denn immerhin muss...

TomsonThomson 20. Nov 2020

Bringt dir halt nur gar nix, wenn die Software die man braucht kein ROCm unterstüzt. Was...

elknipso 19. Nov 2020

Werd erwachsen.



Aktuell auf der Startseite von Golem.de
Sicherheitslücke
Die Schadsoftware, die auf ausgeschalteten iPhones aktiv ist

Forschern ist es gelungen, eine Schadsoftware auf ausgeschalteten iPhones mit vermeintlich leerem Akku auszuführen. Denn ganz aus sind diese nicht.

Sicherheitslücke: Die Schadsoftware, die auf ausgeschalteten iPhones aktiv ist
Artikel
  1. Bundeswehr: Das Heer will sich nicht abhören lassen
    Bundeswehr
    Das Heer will sich nicht abhören lassen

    Um sicher zu kommunizieren, halten die Landstreitkräfte in NATO-Missionen angeblich ihre Panzer an und verabreden sich "von Turm zu Turm".
    Ein Bericht von Matthias Monroy

  2. The Valiant: Ritterliche Strategie mit Theoderich von Akenburg
    The Valiant
    Ritterliche Strategie mit Theoderich von Akenburg

    Actionlastige PC-Echtzeit-Strategie im mittelalterlichen Szenario will The Valiant bieten - und eine Handlung rund um ein mythisches Relikt.

  3. Milliarden-Übernahme: Musk spricht von günstigerem Übernahmeangebot für Twitter
    Milliarden-Übernahme  
    Musk spricht von günstigerem Übernahmeangebot für Twitter

    Mit Blick auf die Zählung von Spam-Konten bei Twitter hat Elon Musk gefragt, ob die mehr als 200 Millionen Twitter-Nutzer angerufen worden seien.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Cyber Week: Bis zu 400€ Rabatt auf Gaming-Stühle • AOC G3 Gaming-Monitor 34" UWQHD 165 Hz günstig wie nie: 404€ • Xbox Series X bestellbar • MindStar (u.a. Gigabyte RTX 3090 24GB 1.699€) • LG OLED TV (2021) 65" 120 Hz 1.499€ statt 2.799€ [Werbung]
    •  /