Vega 20 ist für HPC gedacht

Die Radeon VII basiert auf dem Vega 20 genannten Grafikchip, welcher auf den Vega 10 der Radeon RX Vega 64/56 folgt. Die GPU wurde ursprünglich für die Radeon Instinct MI60/MI50 entwickelt, also die beiden AMD-Beschleunigerkarten für High Performance Computing (HPC) wie Klimaforschung und für maschinelles Lernen. Der Name der Karte rührt von ihrer Geschwindigkeit bei reduzierter Ganzzahl-Genauigkeit (INT8) her, die um ein Vierfaches höher liegt als bei gewöhnlichen FP32-Berechnungen. Mit FP16-Gleitkomma schaffen Vega 10/20 immer noch die doppelte Leistung der einfachen Genauigkeit.

Stellenmarkt
  1. (Senior) IT Security Engineer (w/m/d)
    NSCON GmbH, Frankfurt, München, Hamburg, Berlin, Köln (Home-Office)
  2. IT-Administrator (m/w/d) Schwerpunkt MS Exchange
    ARNECKE SIBETH DABELSTEIN Rechtsanwälte Steuerberater Partnerschaftsgesellschaft mbB, Frankfurt am Main, Berlin
Detailsuche

Im vierten Quartal 2018 konnte AMD einen Rekordumsatz im Bereich der Server-GPUs erzielen, sprich - die beiden Radeon Instinct scheinen sich oft zu verkaufen und offenbar sind sie auch in ausreichender Stückzahl verfügbar. Das spricht dafür, dass TSMCs N7-Fertigungsverfahren eine gute Ausbeute aufweist, denn alle Vega 20 werden in diesem 7-nm-DUV-Node hergestellt. Die Tatsache, dass AMD noch Chips für einige Radeon VII abzweigen kann, statt alle für die viel Margen-trächtigeren Radeon Instinct zu verwenden, untermauert diese Annahme. Ein bisschen Verschnitt gibt es aber immer, weshalb die Radeon VII nur 60 Compute Units aufweist, der Vollausbau mit 64 CUs ist der Radeon Instinct MI60 vorbehalten.

  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)
  • Die Radeon VII hat eine 1:4-Geschwindigkeit für FP64 (Bild: Marc Sauter/Golem.de)
Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)

Ausgehend von Vega 10 steigt die Transistor-Anzahl bei Vega 20 kaum: Statt 12,5 Milliarden sind es 13,2 Milliarden und die Chipgröße verringert sich von 495 mm² auf 331 mm². Das N7-Verfahren nutzte AMD primär um ein vorhandenes Design für den HPC-Markt anzupassen: Vega 20 verdoppelt das Interface auf 4.096 Bit und bindet vier HBM2-Speicherstapel mit je 4 GByte für insgesamt 16 GByte an - bei Vega 10 sind es 2.048 Bit für zwei Stacks und 8 GByte; die Bandbreite verdoppelt sich also. Denkbar wären für eine Radeon Instinct MI60 auch gleich 32 GByte wie bei Nvidias Tesla V100, die hat aber auch mehr Rechenleistung. Ein eigenes Package spendiert AMD der Radeon VII vermutlich deshalb nicht, weil vier Stacks mit je zwei GByte eine eigene und somit teure Fertigung erfordern würde. Detail am Rande: Weil anders als bei Nvidia die ROPS vom Interface entkoppelt sind, hat Vega 20 wie Vega 10 auch 64 Raster-Endstufen statt gleich 128, welche in den meisten Anwendungen aber ohnehin nicht limitieren.

Vega 10 (MI25 / Vega 64)Vega 20 (MI60)Vega 20 (Radeon VII)
Fertigungsverfahren14LPP (GloFo)N7 (TSMC)N7 (TSMC)
Die-Size495 mm²331 mm²331 mm²
Transistoren12,5 Milliarden13,2 Milliarden13,2 Milliarden
Compute Units646460
Shader ALUs4.0964.0963.840
FP64ja, 1:16ja, 1:2ja, 1:4
FP16ja, 2:1ja, 2:1ja, 2:1
INT8ja, 4:1ja, 4:1(?)
INT4neinja, 8:1(?)
Textur-Einheiten256256240
Raster-Endstufen646464
Interface2.048 Bit4.096 Bit4.096 Bit
L2-Cache4 MByte4 MByte (?)4 MByte (?)
Videospeicher8 GByte HBM216 GByte HBM216 GByte HBM2
AnbindungPCIe Gen3 x16PCIe Gen4 x16PCIe Gen3 x16
Technische Daten von AMDs Vega-GPUs

Um die Radeon Instinct MI50 preislich von der Radeon VII abzugrenzen, hat AMD die Consumer-Karte um ein paar Funktionen beschnitten: Auch wenn der Vega 20 prinzipiell ein 1:2-Verhältnis von FP64-zu-FP32-Leistung aufweist, schaltet der Hersteller eine 1:4-Ratio frei. Das ist das Vierfache einer Radeon RX Vega 64 mit Vega 10 und das Achtfache (!) dessen, was Nvidia bei seinen Geforce-RTX-Modellen bereitstellt. Auch unterstützt Vega 20 anders als Vega 10 schnelle INT8-Berechnungen für Inferencing, was bei der Radeon VII offenbar aktiviert ist. Eine weitere Änderung ist die Anbindung an die CPU, hier unterstützt die Radeon VII aber nur PCIe Gen3 statt PCIe Gen4, was wir angesichts der Ryzen 3000 (Matisse) mit PCIe Gen4 schade finden.

Golem Akademie
  1. Hands-on C# Programmierung: virtueller Zwei-Tage-Workshop
    12.–13. Januar 2022, virtuell
  2. First Response auf Security Incidents: Ein-Tages-Workshop
    4. März 2022, Virtuell
Weitere IT-Trainings

Ob und welche Änderungen abseits der FP64-Leistung und der verdoppelten Datentransfer-Rate durch vier Stacks am Vega 20 vorgenommen wurden, darüber schweigt AMD. Auf Nachfrage nannte der Hersteller verbesserte Akkumulatoren, womit üblicherweise die Register der Shader-Einheiten gemeint sind. Denkbar ist, dass AMD diese vergrößert hat, um die Datenlokalität zu erhöhen. Generelle Optimierungen betreffen Anpassungen für einen leicht gestiegenen Chiptakt und geringere Latenzen, wobei hier unklar ist, welche genau. Laut Hersteller soll die Radeon VII unter Last grob 200 MHz schneller rechnen als eine luftgekühlte Radeon RX Vega 64 im Referenz-Design. Custom-Designs laufen leicht flotter, mehr als fünf Prozent sind aber selten.

Mit 64 statt 32 Sensoren misst Vega 20 laut AMD die anliegende Temperatur der einzelnen GPU-Bestandteile genauer als Vega 10. Die so ermittelte Junction Temperature ist an sich nicht neu, wurde aber bisher nur als Schwellenwert zur Notabschaltung herangezogen. Bei der Radeon VII verwendet AMD die Informationen, um die Leistung ein kleines bisschen zu steigern, weil kritische Funktionsblöcke näher an ihrem Limit betrieben werden können. In der Praxis limitiert allerdings zumeist das Power-Target des Grafikchips oder aber die Radeon Software im CPU-Limit in niedrigen Auflösungen wie 1080p.

Der Decode/Encode-Teil des Vega 20 ist weiterhin der bekannte UVD respektive VCE und nicht der neuere VCN (Video Core Next). Damit geht einher, dass die Radeon VII kein VP9 in Hardware per fest verdrahteten Einheiten decodiert/encodiert, sondern die Shader bemühen muss. Das klappt zwar auch in 4K60 flüssig, aber eben auf Kosten der Leistungsaufnahme. Zur Erinnerung: Google nutzt VP9 für Youtube. Laut Linux-Patches enthält die Vega 20 zwei Decode-Blöcke, was sinnvoll für Fotos und Videos ist, in denen Gesichter oder Objekte identifiziert sowie klassifiziert werden sollen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Die Radeon VII im DetailEs reicht für Nvidias RTX 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Shrimpy 20. Feb 2019

Bis jetzt hat jeder GCN von seinem "zu großen" speicher profitiert. Vega 7 hier wird es...

Mimimimimi 17. Feb 2019

Wenn du alles so toll weißt - warum fragst du dann noch hier? Dann empfehle ihn doch...

Anonymer Nutzer 12. Feb 2019

Eine wichtige Kleinigkeit ist beim Test übersehen worden. Offensichtlich hat AMD bei...

Neuro-Chef 11. Feb 2019

Oder einfach eine Distribution mit immer aktueller Software zu verwenden.

Entchen 09. Feb 2019

Also wenn man das Potential von Cb hernimmt, landet man irgendwo bei gut 200W herum, was...



Aktuell auf der Startseite von Golem.de
Softwarepatent
Uraltpatent könnte Microsoft Millionen kosten

Microsoft hat eine Klage um ein Software-Patent vor dem BGH verloren. Das Patent beschreibt Grundlagentechnik und könnte zahlreiche weitere Cloud-Anbieter betreffen.
Ein Bericht von Stefan Krempl

Softwarepatent: Uraltpatent könnte Microsoft Millionen kosten
Artikel
  1. Krypto: Angeblicher Nakamoto darf 1,1 Millionen Bitcoin behalten
    Krypto
    Angeblicher Nakamoto darf 1,1 Millionen Bitcoin behalten

    Ein Gericht hat entschieden, dass Craig Wright der Familie seines Geschäftspartners keine Bitcoins schuldet - kommt jetzt der Beweis, dass er Satoshi Nakamoto ist?

  2. Fusionsgespräche: Orange und Vodafone wollten zusammengehen
    Fusionsgespräche
    Orange und Vodafone wollten zusammengehen

    Die führenden Netzbetreiber in Europa wollen immer wieder eine Fusion. Auch aus den letzten Verhandlungen wurde jedoch bisher nichts.

  3. Spielfilm: Matrix trifft Unreal Engine 5
    Spielfilm
    Matrix trifft Unreal Engine 5

    Ist der echt? Neo taucht in einem interaktiven Programm auf Basis der Unreal Engine 5 auf. Der Preload ist bereits möglich.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MM Weihnachtsgeschenkt (u. a. 3 Spiele kaufen, nur 2 bezahlen) • PS5 & Xbox Series X mit o2-Vertrag bestellbar • Apple Days bei Saturn (u. a. MacBook Air M1 949€) • Switch OLED 349,99€ • Saturn-Advent: HP Reverb G2 + Controller 499,99€ • Logitech MX Keys Mini 89,99€ [Werbung]
    •  /