• IT-Karriere:
  • Services:

Mining-Tricks und HBCC

Schon Polaris kann Gleitkomma-Berechnungen mit halber statt einfacher Genauigkeit durchführen. Vega hingegen beherrscht Half Precision (FP16) mit zweifacher Geschwindigkeit verglichen mit Single Precision (FP32). Derartige Float-Formate sind an sich nicht neu, sie werden im Mobile-Segment oder für künstliche Intelligenz angewendet und wurden früher schon bei Grafikkarten (hallo Geforce FX) eingesetzt. FP16 mit doppeltem Durchsatz wird von id Software für Wolfenstein 2 und von Ubisoft für Far Cry 5 verwendet; Zahlen liegen nicht vor. Eine neue 3DMark-Szene namens Serra zeigt Zuwächse von über 20 Prozent, wenn FP16 für die Beleuchtung genutzt wird.

  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Radeon RX Vega 64 Air Cooled (Foto: Marc Sauter/Golem.de)
  • Die Backplate dient nur der Optik. (Foto: Marc Sauter/Golem.de)
  • Zwei 8-Pol-Anschlüsse sind wichtig für Overclocking. (Foto: Marc Sauter/Golem.de)
  • Wie Fiji weist auch Vega 10 nur 4.096 Shader-Kerne auf. (Foto: Marc Sauter/Golem.de)
  • Vega 10 nutzt zwei HBM2-Stacks. (Foto: Marc Sauter/Golem.de)
  • Dem Mockup fehlt das Füllmaterial zwischen den Dies. (Foto: Marc Sauter/Golem.de)
  • Wafer mit Vega-10-Chips (Bild: AMD)
  • Die Vega 64 unterstützt Direct3D Feature Level 12_1. (Bild: AMD)
  • Conservative Rasterization eignet sich für Schattenberechnungen. (Bild: AMD)
  • 3x DP 1.4 und 1x HDMI 2.0 (Foto: Marc Sauter/Golem.de)
  • Die Vega 64 unterstützt 5K bei 60 Hz mit HDR. (Bild: AMD)
  • Der Bios-Switch reduziert die GPU-Power. (Foto: Marc Sauter/Golem.de)
  • Im Wattman gibt es drei Profile, die das Power Target ändern. (Screenshot: Marc Sauter/Golem.de)
  • Der obere Radeon-Schriftzug ist beleuchtet. (Foto: Marc Sauter/Golem.de)
  • GPU Tach zeigt die Auslastung der Karte an. (Foto: Marc Sauter/Golem.de)
  • Hierzu gibt es neun LEDs. (Foto: Marc Sauter/Golem.de)
  • Per Dip-Schalter kann GPU Tach deaktiviert werden. (Foto: Marc Sauter/Golem.de)
  • Vega 10 hat einen Tile-based Rasterizer. (Bild: AMD)
  • Er spart Bandbreite und Energie. (Bild: AMD)
  • Per Primitive Shader kann Vega 10 frühzeitig Dreiecke verwerfen. (Bild: AMD)
  • Im Idealfall steigt dadurch die Leistung drastisch an. (Bild: AMD)
  • Mit FP16 können etwa Bloom-Shader beschleunigt werden. (Bild: AMD)
  • Vega 10 unterstützt die XAD_U32-Instruktion für Mining. (Bild: AMD)
  • Vega weist einen High Bandwidth Cache Controller auf. (Bild: AMD)
  • Der HBCC arbeitet exklusiv ... (Bild: AMD)
  • ... oder inklusiv. (Bild: AMD)
  • Im Radeon-Treiber kann die Größe des Caches eingestellt werden. (Screenshot: Marc Sauter/Golem.de)
  • Benchmark-Szene von Battlefield  (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: EA)
  • Benchmark-Szene von Dishonored 2 (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Bethesda)
  • Benchmark-Szene von Doom (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Bethesda)
  • Benchmark-Szene von Gears of War 4 (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Microsoft)
  • Benchmark-Szene von CoD Infinite Warfare (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Activision)
  • Die Vega 64 positioniert sich zwischen der Geforce GTX 1080 und der Ti-Version. (Foto: Marc Sauter/Golem.de)
Mit FP16 können etwa Bloom-Shader beschleunigt werden. (Bild: AMD)
Stellenmarkt
  1. Dynamit Nobel Defence GmbH, Berlin
  2. Universitätsklinikum Tübingen, Tübingen

Abseits von FP16 unterstützt Vega auch INT16 und INT32, hinzu kommt INT8. Letzteres läuft gar mit vierfacher Rate verglichen mit FP32, was für Deep Learning interessant ist. Inferencing, also der Schritt nach dem Training, kann auf einer Radeon RX Vega 64 mit 51 Tera-Ops erfolgen. Für ein paar Versuche daheim ist die Gaming-Karte zwar geeignet, wer solche Berechnungen aber im größeren Stil ausführen möchte, für den hat AMD die Radeon Instinct MI25 genannten Rechenbeschleuniger ab Herbst 2017 im Angebot.

Wer Vega für Ethereum-Mining nutzen möchte, kann derzeit auf rund 31 Megahashes pro Sekunde zurückgreifen. Offenbar hat AMD die Radeon RX Vega 64 bewusst nicht auf das Schürfen von Kryptowährungen hin optimiert, obgleich die hohe Bandbreite von fast 500 GByte pro Sekunde die Karte sehr interessant dafür macht. Denkbar wären spezielle Speicheranpassungen zugunsten einer niedrigen Latenz. Neu ist übrigens die XAD_U32-Instruktion (ADD+XOR für INT32), allerdings dürfte die Ethereum-Rate dadurch nicht steigen.

  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Ryzen 7 1800X, 16 GByte DDR4-3200; Windows 10, Geforce 385.12, Radeon Software 17.30.1051
  • Radeon RX Vega 64 Air Cooled (Foto: Marc Sauter/Golem.de)
  • Die Backplate dient nur der Optik. (Foto: Marc Sauter/Golem.de)
  • Zwei 8-Pol-Anschlüsse sind wichtig für Overclocking. (Foto: Marc Sauter/Golem.de)
  • Wie Fiji weist auch Vega 10 nur 4.096 Shader-Kerne auf. (Foto: Marc Sauter/Golem.de)
  • Vega 10 nutzt zwei HBM2-Stacks. (Foto: Marc Sauter/Golem.de)
  • Dem Mockup fehlt das Füllmaterial zwischen den Dies. (Foto: Marc Sauter/Golem.de)
  • Wafer mit Vega-10-Chips (Bild: AMD)
  • Die Vega 64 unterstützt Direct3D Feature Level 12_1. (Bild: AMD)
  • Conservative Rasterization eignet sich für Schattenberechnungen. (Bild: AMD)
  • 3x DP 1.4 und 1x HDMI 2.0 (Foto: Marc Sauter/Golem.de)
  • Die Vega 64 unterstützt 5K bei 60 Hz mit HDR. (Bild: AMD)
  • Der Bios-Switch reduziert die GPU-Power. (Foto: Marc Sauter/Golem.de)
  • Im Wattman gibt es drei Profile, die das Power Target ändern. (Screenshot: Marc Sauter/Golem.de)
  • Der obere Radeon-Schriftzug ist beleuchtet. (Foto: Marc Sauter/Golem.de)
  • GPU Tach zeigt die Auslastung der Karte an. (Foto: Marc Sauter/Golem.de)
  • Hierzu gibt es neun LEDs. (Foto: Marc Sauter/Golem.de)
  • Per Dip-Schalter kann GPU Tach deaktiviert werden. (Foto: Marc Sauter/Golem.de)
  • Vega 10 hat einen Tile-based Rasterizer. (Bild: AMD)
  • Er spart Bandbreite und Energie. (Bild: AMD)
  • Per Primitive Shader kann Vega 10 frühzeitig Dreiecke verwerfen. (Bild: AMD)
  • Im Idealfall steigt dadurch die Leistung drastisch an. (Bild: AMD)
  • Mit FP16 können etwa Bloom-Shader beschleunigt werden. (Bild: AMD)
  • Vega 10 unterstützt die XAD_U32-Instruktion für Mining. (Bild: AMD)
  • Vega weist einen High Bandwidth Cache Controller auf. (Bild: AMD)
  • Der HBCC arbeitet exklusiv ... (Bild: AMD)
  • ... oder inklusiv. (Bild: AMD)
  • Im Radeon-Treiber kann die Größe des Caches eingestellt werden. (Screenshot: Marc Sauter/Golem.de)
  • Benchmark-Szene von Battlefield  (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: EA)
  • Benchmark-Szene von Dishonored 2 (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Bethesda)
  • Benchmark-Szene von Doom (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Bethesda)
  • Benchmark-Szene von Gears of War 4 (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Microsoft)
  • Benchmark-Szene von CoD Infinite Warfare (Screenshot: Marc Sauter/Golem.de, Rechteinhaber: Activision)
  • Die Vega 64 positioniert sich zwischen der Geforce GTX 1080 und der Ti-Version. (Foto: Marc Sauter/Golem.de)
Vega weist einen High Bandwidth Cache Controller auf. (Bild: AMD)

Eine von AMD oft angesprochene Funktion ist der High Bandwidth Cache Controller. Er wurde eher für professionelle Anwendungen mit enorm vielen Daten entwickelt und ist im Radeon-Treiber ausgeschaltet. Wer möchte, kann den HBCC aber aktivieren und den Systemspeicher mit den lokalen 8 GByte HBM2 der Radeon RX Vega 64 kombinieren. Bei unserem Testrechner konnten wir bis zu 16 GByte einstellen, dem Controller also 8 GByte RAM zuweisen. Im Bedarfsfall werden Speicherseiten (Pages) geladen, was die Leistung verbessern kann. Sofern der HBM2 aber nicht überläuft, ändert sich unseren Stichproben zufolge an der Bildrate oder den Frametimes wenig bis nichts.

Genug vom Vega-Chip, wenden wir uns der eigentlichen Karte zu.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Vega verwirft viele DreieckeRX Vega 64 AC im Detail 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10.  


Anzeige
Spiele-Angebote
  1. 8,75€
  2. 8,99€
  3. 4,25

B.I.G 18. Aug 2017

Also so wie AMD ihre Karten aufbauen würde ich ehr sagen, wird offiziell nicht dafür...

PoorVega 16. Aug 2017

Das ist doch völlig Normal. Sieh dir mal die aktuellen AMD-Preise an. Völlig klar, dass...

ArcherV 16. Aug 2017

Das ist vollkommen richtig.

Compufreak345 16. Aug 2017

Eine Diskussion mit einer Beleidigung zu beenden ist immer super und zeugt von geistiger...

pigzagzonie 15. Aug 2017

Leistungsfähig - ohne "er". Software läuft teils gar nicht auf Consumer-Cards. Wenn doch...


Folgen Sie uns
       


Outriders angespielt

Im Video stellt Golem.de das von People Can Fly entwickelte Actionspiel Outriders vor.

Outriders angespielt Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /