• IT-Karriere:
  • Services:

RDNA2: To Infinity and Beyond!

Während der Navi 10 noch als Midrange-Chip designt worden war, war Navi 21 von Beginn an für Größeres bestimmt: Beide GPUs lässt AMD beim Auftragsfertiger TSMC produzieren, es kommt jeweils das N7P-Verfahren mit klassischer Immersionslithografie (DUV) zum Einsatz. Mit 519 mm² und 26,8 Milliarden Transistoren weist der Navi 21 mehr als die doppelte Die-Fläche und gut die 2,5-fache Menge an Schaltelementen auf (251 mm² bei 10,3 Milliarden).

Stellenmarkt
  1. Kommunale Versorgungskassen Westfalen-Lippe, Münster
  2. m3connect GmbH, Aachen

Die überproportional gestiegene Menge an Transistoren lässt sich vergleichsweise leicht erklären: So hat AMD zwar die Menge der Compute Units samt den Shader-ALUs und Textureinheiten ebenso verdoppelt wie die Anzahl der verbesserten Raster-Endstufen (ROPs), es aber nicht dabei belassen. Auch die GPU-Frequenz steigt von rund 1,9 GHz auf fast 2,3 GHz und die einzelnen Blöcke wurden in ihrem Funktionsumfang erweitert.

Anstatt jedoch das GDDR6-Speicherinterface von 256 Bit auf 512 Bit zu verdoppeln, hat sich AMD für eine ungewöhnliche Lösung entschieden. Vorab sei gesagt, dass ein 512-Bit-Interface nicht neu wäre, denn das gab es schon bei der Radeon R9 290X. Der Platzbedarf im Chip ist allerdings enorm und das Routing auf der Platine äußerst aufwendig. Nvidia nutzt daher 384 Bit mit extrem schnellem GDDR6X-Speicher bei den Geforce-Karten und teurem HBM2(E)-Stacked-Memory bei den HPC-Beschleunigern.

  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • RDNA2 taktet höher als RDNA1. (Bild: AMD)
  • Ungeachtet dessen steigt die Effizienz. (Bild: AMD)
  • Statt 384 Bit gibt es den Infinity Cache. (Bild: AMD)
  • Der liefert eine weitaus höhere Bandbreite als GDDR6 ... (Bild: AMD)
  • ... bei einer durchschnittlich niedrigeren Latenz. (Bild: AMD)
  • Der Infinity Cache taktet dynamisch zugunsten der Effizienz. (Bild: AMD)
  • Auch die anderes Caches wurden überarbeitet, etwa der L2. (Bild: AMD)
  • Jede Compute Unit umfasst einen Ray Accelerator zur Schnittpunktprüfung. (Bild: AMD)
  • Navi 21 unterstützt DirectX 12 Ultimate. (Bild: AMD)
  • Formate wie INT8 sind für Super Resolution wichtig. (Bild: AMD)
Navi 21 im Überblick (Bild: AMD)
Navi 14Navi 10Navi 21
FertigungN7P (TSMC)N7P (TSMC)N7P (TSMC)
Die-Size 158 mm²251 mm²519 mm²
Transistoren6,4 Milliarden10,3 Milliarden 26,8 Milliarden
Compute Units244080
Shader-ALUs1.5362.5605.120
Textureinheiten96160320
Ray Acceleratorn.v.n.v.80
L2-Cache2 MByte4 MByte4 MByte (sic!)
Interface128 Bit256 Bit256 Bit + Infinity Cache (128 MByte)
SpeicherGDDR6GDDR6GDDR6
ROPs3264128
Spezifikationen der Navi-GPUs von AMD

Grundsätzlich wird eine hohe Transfer-Rate benötigt, damit die GPU die notwendigen Daten zur Verarbeitung möglichst schnell geliefert bekommt. Es lohnt sich daher, Informationen lokal vorzuhalten - Microsoft hatte beim SoC der Xbox 360 ein paar MByte an eDRAM verbaut und Intel nutzte einst eDRAM als L4 (Crystalwell). Noch besser ist SRAM, weshalb der Chip der Xbox One davon 32 MByte aufweist und Nvidia beim GA100-Chip für Supercomputer gleich 48 MByte L2-Cache integriert. AMD führt dieses Prinzip fort, wenngleich eine Stufe weiter oben in der Puffer-Hierarchie.

Passend zum Fabric, das alle Funktionsblöcke im Navi 21 verknüpft, wird der GPU-nahe Speicher als Infinity Cache bezeichnet. Während das 256-Bit-Interface zwar 16 GByte GDDR6 anbindet, überträgt es nur 512 GByte/s. Der Infinity Cache hingegen besteht aus 128 MByte SRAM und liefert in der Spitze bis zu 2 TByte! Möglich wird das durch ein 1.024 Bit breites Interface und Speicherzellen, die wie das Infinity Fabric auf bis zu 1,94 GHz hochtakten können. Der Clou: Wird mehr Bandbreite gebraucht, steigt die Frequenz - muss die GPU ran, wird der Infinity Cache langsamer und gibt so Energie frei.

AMD Radeon RX 6800 (XT)
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • Navi 21 im Überblick (Bild: AMD)
  • RDNA2 taktet höher als RDNA1. (Bild: AMD)
  • Ungeachtet dessen steigt die Effizienz. (Bild: AMD)
  • Statt 384 Bit gibt es den Infinity Cache. (Bild: AMD)
  • Der liefert eine weitaus höhere Bandbreite als GDDR6 ... (Bild: AMD)
  • ... bei einer durchschnittlich niedrigeren Latenz. (Bild: AMD)
  • Der Infinity Cache taktet dynamisch zugunsten der Effizienz. (Bild: AMD)
  • Auch die anderes Caches wurden überarbeitet, etwa der L2. (Bild: AMD)
  • Jede Compute Unit umfasst einen Ray Accelerator zur Schnittpunktprüfung. (Bild: AMD)
  • Navi 21 unterstützt DirectX 12 Ultimate. (Bild: AMD)
  • Formate wie INT8 sind für Super Resolution wichtig. (Bild: AMD)
Statt 384 Bit gibt es den Infinity Cache. (Bild: AMD)

Neben der reinen Bandbreite ist SRAM zudem DRAM bei der Latenz überlegen, vereinfacht ausgedrückt erfolgen Zugriffe im besten Fall etwa doppelt so flott. Weil der Infinity Cache alleine aber nicht ausreicht und auch Daten im GDDR6-Speicher liegen, soll laut AMD die durchschnittliche Latenz bei Navi 21 um ein Drittel kürzer sein als bei Navi 10. Hinzu kommt, dass GDDR6 vergleichsweise viel Energie aufnimmt - der Infinity Cache ist weitaus sparsamer, die Effizienz des Speichersubsystems steigt also drastisch an.

Ein gewollter Nebeneffekt des Puffers stellt überdies der positive Performance-Einfluss bei Raytracing dar, denn der Infinity Cache spielt hier eine entscheidende Rolle. Als eine der wichtigsten Neuerungen verfügt die RDNA2-Architektur von Navi 21 über sogenannte Ray Accelerators, also Hardware, um Raytracing-Berechnungen schneller zu erledigen. In jeder Compute Unit (CU) sitzt einer davon als Teil der vierfach ausgelegten Textureinheit (Quad-TMU), so wie sich bei Nvidia in jedem Shader Multiprocessor (SM) ein RT-Core befindet. Technisch unterscheiden sich beide Ansätze deutlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Radeon RX 6800 (XT) im Test: Die Rückkehr der Radeon-RitterRDNA2: Ray Accelerator & DX12 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10.  


Anzeige
Spiele-Angebote
  1. 15,99€
  2. 17,99€
  3. 4,87€
  4. 27,99€

yumiko 11:42 / Themenstart

Kuriosität wäre eien gute Voraussetzung für einen ausführlichen Technik Artikel ^^ Für...

ms (Golem.de) 20. Nov 2020 / Themenstart

Das ist schlicht AMDs eigene Bezeichnung für Resizable BAR Support, denn immerhin muss...

TomsonThomson 20. Nov 2020 / Themenstart

Bringt dir halt nur gar nix, wenn die Software die man braucht kein ROCm unterstüzt. Was...

elknipso 19. Nov 2020 / Themenstart

Werd erwachsen.

Dwalinn 19. Nov 2020 / Themenstart

Kann ja sein ist in den Zusammenhang aber egal. Ja da hast du recht. Die Aussage...

Kommentieren


Folgen Sie uns
       


Assassin's Creed Valhalla - Fazit

Im Video stellt Golem.de das Action-Rollenspiel Assassins's Creed Valhalla vor, das Spieler als Wikinger nach England schickt.

Assassin's Creed Valhalla - Fazit Video aufrufen
Radeon RX 6800 (XT): Das Unboxing als Gelegenheit
Radeon RX 6800 (XT)
Das Unboxing als Gelegenheit

Am 18. November 2020 erscheinen die Radeon RX 6800 (XT) . Wir zeigen vorab, welche Grafikkarten, Apps und Spiele wir einsetzen.
Von Marc Sauter

  1. Radeon RX 6000 AMD sieht sich in Benchmarks vor Nvidia
  2. Big Navi (RDNA2) Radeon RX 6900 XT holt Geforce RTX 3090 ein
  3. Navi-21-Grafikkarte RX 6900 XT tritt mit 5.120 Shadern und 16 GByte an

Kampf der Konsolen: Xbox Series X/S und Playstation 5 im Detailvergleich
Kampf der Konsolen
Xbox Series X/S und Playstation 5 im Detailvergleich

Beide schick, beide gut: Die Wahl zwischen Xbox Series X/S und PS5 fällt schwer. Im Detail gibt es aber Unterschiede, die durchaus entscheidend sein können.
Von Peter Steinlechner


    Pixel 4a 5G im Test: Das alternative Pixel 5 XL
    Pixel 4a 5G im Test
    Das alternative Pixel 5 XL

    2020 gibt es kein Pixel 5 XL - oder etwa doch? Das Pixel 4a 5G ist größer als das Pixel 5, die grundlegende Hardware ist ähnlich bis gleich. Das Smartphone bietet trotz Abstrichen eine Menge.
    Ein Test von Tobias Költzsch

    1. Schnelle Webseiten Google will AMP-Seiten nicht mehr bevorzugen
    2. Digitale-Dienste-Gesetz Will die EU-Kommission doch keine Konzerne zerschlagen?
    3. Google Fotos Kein unbegrenzter Fotospeicher für neue Pixel

      •  /