• IT-Karriere:
  • Services:

RDNA macht Navi stark

Im Navi-10-Chip steckt die erste Version der RNDA-Technik, wie schon bei GCN wird AMD sie in den nächsten Jahren erweitern und verbessern. Der grundsätzliche Aufbau bei RDNA ist altbekannt: Der Chip integriert eine Display-Einheit, einen Multimedia-Block, einen Root-Controller, diverse Caches, zwei statt vier Shader-Engines (wie Vega 10) und darin die eigentlichen Compute Units.

Stellenmarkt
  1. Versicherungskammer Bayern, München
  2. meta Trennwandanlagen GmbH & Co. KG, Rengsdorf

Neu ist die Unterstützung für 16 PCIe-Gen4-Lanes, was die Geschwindigkeit verglichen zu PCIe Gen3 verdoppelt. Um diesen Vorteil nutzen zu können, ist ein passender Prozessor notwendig - genauer ein Ryzen 3000 samt X570-Chip, die AMD ebenfalls heute veröffentlicht hat. Für Spiele ist PCIe Gen4 vorerst nicht relevant, einige Anwendungen wie Davinci Resolve sollen beim 8K-Playback in der Timeline aber durch die drastisch höhere Datentransfer-Rate profitieren. Aus Zeitmangel konnten wir dieses Szenario bisher jedoch nicht nachstellen, es sind aber interne Sondertests geplant.

Grundlegend basiert RDNA wie GCN auf weitestgehend der gleichen ISA (Instruction Set Architecture), die Umsetzung in Hardware ist allerdings eine völlig andere: Das Ziel war es, pro Takt deutlich mehr Leistung zu erreichen. Zu diesem Zweck hat AMD die Compute Units umgebaut und erstmals seit vielen Jahren die SIMD-Einheiten und das Cache-System radikal verändert. Der Hersteller spricht von einer 50 Prozent höheren Geschwindigkeit bei gleichem Energiebedarf, wobei davon wiederum gut die Hälfte auf die Architektur und der Rest auf 7 nm sowie Frequenz-Optimierungen entfallen soll.

  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Navi 10 wird in 7 nm gefertigt und nutzt die RDNA-Technik. (Bild: AMD)
  • Radeon DNA ist eine drastisch überarbeitete Architektur. (Bild: AMD)
  • Die Compute Units sind in Doppelpacks zusammengefasst und haben drastisch mehr IPC. (Bild: AMD)
  • Navi verwendet SIMD32-Einheiten und Wave32-Fronts zur besseren Auslastung. (Bild: AMD)
  • Hinzu kommt ein neues Cache-Design mit mehr Pufferspeicher und niedrigeren Latenzen. (Bild: AMD)
  • Die Delta-Farbkompression für effektiv mehr Bandbreite wurde stark überarbeitet. (Bild: AMD)
  • RNDA soll 50 Prozent mehr Leistung haben als GCN bei gleichem Energiebedarf. (Bild: AMD)
  • Navi 10 nutzt den Video Core Next. (Bild: AMD)
  • Radeon RX 5700 XT und Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
Radeon DNA ist eine drastisch überarbeitete Architektur. (Bild: AMD)

Jedes Compute Unit besteht aus 64 ALUs, die durch sogenannte Wavefronts ihre Befehle in Form multipler Threads erhalten. Bisher verwendete AMD eine Wave64-Implementierung, was relativ grobkörnig ist. Nvidia setzt seit Jahren schon auf eine feingranularere Warp32-Umsetzung, was Vorteile bei Verzweigungen im Code hat und so die Auslastung der Shader verbessert. AMD nutzt bei RDNA nun ebenfalls einen Wave32-Ansatz, überdies wurden auch die ALUs an sich verändert, um die ankommende Arbeit in weniger Zeit erledigen zu können.

Statt SIMD16-Einheiten bei GCN sind es SIMD32-Einheiten bei RDNA, womit zwei Wave32-Fronts in einem Takt erledigt werden statt einer Wave64-Front in vier Zyklen. Im besten Fall vervierfacht sich so die Auslastung und die SIMD-Einheiten müssen seltener auf Daten warten. Optional kann der Shader-Compiler weiterhin auch eine Wave64-Front an die SIMD32-Slots liefern, die dann zwei Takte benötigt. Neben den regulären Vektor- gibt es doppelt so viele Skalar- und Scheduler-Einheiten wie bei GCN. Zudem sollen die Asynchronous-Compute-Engines die CUs besser mit Daten versorgen.

  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Core i9-9900K, 16GB DDR4-2666, Win10 v1930, GF 431.16, RS 19.7.1 (Bild: Golem.de)
  • Navi 10 wird in 7 nm gefertigt und nutzt die RDNA-Technik. (Bild: AMD)
  • Radeon DNA ist eine drastisch überarbeitete Architektur. (Bild: AMD)
  • Die Compute Units sind in Doppelpacks zusammengefasst und haben drastisch mehr IPC. (Bild: AMD)
  • Navi verwendet SIMD32-Einheiten und Wave32-Fronts zur besseren Auslastung. (Bild: AMD)
  • Hinzu kommt ein neues Cache-Design mit mehr Pufferspeicher und niedrigeren Latenzen. (Bild: AMD)
  • Die Delta-Farbkompression für effektiv mehr Bandbreite wurde stark überarbeitet. (Bild: AMD)
  • RNDA soll 50 Prozent mehr Leistung haben als GCN bei gleichem Energiebedarf. (Bild: AMD)
  • Navi 10 nutzt den Video Core Next. (Bild: AMD)
  • Radeon RX 5700 XT und Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 XT (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
  • Radeon RX 5700 (Bild: Marc Sauter/Golem.de)
Navi verwendet SIMD32-Einheiten und Wave32-Fronts zur besseren Auslastung. (Bild: AMD)

AMD spricht von Dual Compute Units, denn immer 2x 32 ALUs werden in einer solchen zusammengefasst. Sie teilen sich den L0-Cache mit 16 KByte und verdoppelter Bandbreite, denn bisherig sprach AMD in diesem Kontext von einem L1-Cache. Der wiederum wird nun von fünf Dual Compute Units gemeinsam verwendet, er fasst 128 KByte. Noch größer, aber langsamer ist der L3-Cache mit 4 MByte. Das ist das Doppelte von Polaris 10 (RX 480) und entspricht Vega 10, allerdings hat Navi 10 nur 40 CUs statt 64 CUs und somit mehr Pufferplatz pro Compute Unit.

Zudem will AMD bei RDNA die Cache-Latenzen reduziert und die verlustfreie Delta-Farbkompression verbessert haben. Letztere verringert den effektiven Bedarf an Bandbreite, nicht aber die notwendige Menge an Platz in den Puffern oder im GDDR6-Videospeicher. Dieser wird mit vier 64-Bit-Controllern angebunden und ist mit 64 Raster-Endstufen verzahnt, also doppelt so vielen wie bei Polaris 10.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Radeon RX 5700 (XT) im Test: AMDs günstige Navi-Karten sind auch superRX 5700 (XT) im Detail 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


Anzeige
Spiele-Angebote
  1. 31€
  2. 27,99€
  3. 17,99€
  4. 11,49€

yumiko 19. Jul 2019

Die 2060S ist etwa 5% langsamer als die 5700 ohne XT. Und im Schnitt fast 100¤ teurer...

Ladestecker 14. Jul 2019

Der Lüftertyp ist lediglich typisch laut, sonst aber überzeugt die Karte doch sehr, da...

Jhomas5 12. Jul 2019

"oder ob nicht vielleicht doch eine gebrauchte Karte die beste Wahl ist." +1 Ich hab mir...


Folgen Sie uns
       


Zwischenzertifikate: Zertifikatswechsel bei Let's Encrypt steht an
Zwischenzertifikate
Zertifikatswechsel bei Let's Encrypt steht an

Bisher war das Let's-Encrypt-Zwischenzertifikat von Identrust signiert. Das wird sich bald ändern.
Von Hanno Böck

  1. CAA-Fehler Let's-Encrypt-Zertifikate werden nicht sofort zurückgezogen
  2. TLS Let's Encrypt muss drei Millionen Zertifikate zurückziehen
  3. Zertifizierung Let's Encrypt validiert Domains mehrfach

Burnout im IT-Job: Mit den Haien schwimmen
Burnout im IT-Job
Mit den Haien schwimmen

Unter Druck bricht ein Webentwickler zusammen - zerrieben von zu eng getakteten Projekten. Obwohl die IT-Branche psychische Belastungen als Problem erkannt hat, lässt sie Beschäftigte oft allein.
Eine Reportage von Miriam Binner


    Core i7-1185G7 (Tiger Lake) im Test: Gut gebrüllt, Intel
    Core i7-1185G7 (Tiger Lake) im Test
    Gut gebrüllt, Intel

    Dank vier äußerst schneller CPU-Kerne und überraschend flotter iGPU gibt Tiger Lake verglichen zu AMDs Ryzen 4000 eine gute Figur ab.
    Ein Test von Marc Sauter

    1. Tiger Lake Überblick zu Intels 11th-Gen-Laptops
    2. Project Athena 2.0 Evo-Ultrabooks gibt es nur mit Windows 10
    3. Ultrabook-Chip Das kann Intels Tiger Lake

      •  /