Abo
  • IT-Karriere:

Vega 20 ist für HPC gedacht

Die Radeon VII basiert auf dem Vega 20 genannten Grafikchip, welcher auf den Vega 10 der Radeon RX Vega 64/56 folgt. Die GPU wurde ursprünglich für die Radeon Instinct MI60/MI50 entwickelt, also die beiden AMD-Beschleunigerkarten für High Performance Computing (HPC) wie Klimaforschung und für maschinelles Lernen. Der Name der Karte rührt von ihrer Geschwindigkeit bei reduzierter Ganzzahl-Genauigkeit (INT8) her, die um ein Vierfaches höher liegt als bei gewöhnlichen FP32-Berechnungen. Mit FP16-Gleitkomma schaffen Vega 10/20 immer noch die doppelte Leistung der einfachen Genauigkeit.

Stellenmarkt
  1. OEDIV KG, Oldenburg
  2. IT-Systemhaus Dresden GmbH, Dresden

Im vierten Quartal 2018 konnte AMD einen Rekordumsatz im Bereich der Server-GPUs erzielen, sprich - die beiden Radeon Instinct scheinen sich oft zu verkaufen und offenbar sind sie auch in ausreichender Stückzahl verfügbar. Das spricht dafür, dass TSMCs N7-Fertigungsverfahren eine gute Ausbeute aufweist, denn alle Vega 20 werden in diesem 7-nm-DUV-Node hergestellt. Die Tatsache, dass AMD noch Chips für einige Radeon VII abzweigen kann, statt alle für die viel Margen-trächtigeren Radeon Instinct zu verwenden, untermauert diese Annahme. Ein bisschen Verschnitt gibt es aber immer, weshalb die Radeon VII nur 60 Compute Units aufweist, der Vollausbau mit 64 CUs ist der Radeon Instinct MI60 vorbehalten.

  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)
  • Die Radeon VII hat eine 1:4-Geschwindigkeit für FP64 (Bild: Marc Sauter/Golem.de)
Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)

Ausgehend von Vega 10 steigt die Transistor-Anzahl bei Vega 20 kaum: Statt 12,5 Milliarden sind es 13,2 Milliarden und die Chipgröße verringert sich von 495 mm² auf 331 mm². Das N7-Verfahren nutzte AMD primär um ein vorhandenes Design für den HPC-Markt anzupassen: Vega 20 verdoppelt das Interface auf 4.096 Bit und bindet vier HBM2-Speicherstapel mit je 4 GByte für insgesamt 16 GByte an - bei Vega 10 sind es 2.048 Bit für zwei Stacks und 8 GByte; die Bandbreite verdoppelt sich also. Denkbar wären für eine Radeon Instinct MI60 auch gleich 32 GByte wie bei Nvidias Tesla V100, die hat aber auch mehr Rechenleistung. Ein eigenes Package spendiert AMD der Radeon VII vermutlich deshalb nicht, weil vier Stacks mit je zwei GByte eine eigene und somit teure Fertigung erfordern würde. Detail am Rande: Weil anders als bei Nvidia die ROPS vom Interface entkoppelt sind, hat Vega 20 wie Vega 10 auch 64 Raster-Endstufen statt gleich 128, welche in den meisten Anwendungen aber ohnehin nicht limitieren.

Vega 10 (MI25 / Vega 64)Vega 20 (MI60)Vega 20 (Radeon VII)
Fertigungsverfahren14LPP (GloFo)N7 (TSMC)N7 (TSMC)
Die-Size495 mm²331 mm²331 mm²
Transistoren12,5 Milliarden13,2 Milliarden13,2 Milliarden
Compute Units646460
Shader ALUs4.0964.0963.840
FP64ja, 1:16ja, 1:2ja, 1:4
FP16ja, 2:1ja, 2:1ja, 2:1
INT8ja, 4:1ja, 4:1(?)
INT4neinja, 8:1(?)
Textur-Einheiten256256240
Raster-Endstufen646464
Interface2.048 Bit4.096 Bit4.096 Bit
L2-Cache4 MByte4 MByte (?)4 MByte (?)
Videospeicher8 GByte HBM216 GByte HBM216 GByte HBM2
AnbindungPCIe Gen3 x16PCIe Gen4 x16PCIe Gen3 x16
Technische Daten von AMDs Vega-GPUs

Um die Radeon Instinct MI50 preislich von der Radeon VII abzugrenzen, hat AMD die Consumer-Karte um ein paar Funktionen beschnitten: Auch wenn der Vega 20 prinzipiell ein 1:2-Verhältnis von FP64-zu-FP32-Leistung aufweist, schaltet der Hersteller eine 1:4-Ratio frei. Das ist das Vierfache einer Radeon RX Vega 64 mit Vega 10 und das Achtfache (!) dessen, was Nvidia bei seinen Geforce-RTX-Modellen bereitstellt. Auch unterstützt Vega 20 anders als Vega 10 schnelle INT8-Berechnungen für Inferencing, was bei der Radeon VII offenbar aktiviert ist. Eine weitere Änderung ist die Anbindung an die CPU, hier unterstützt die Radeon VII aber nur PCIe Gen3 statt PCIe Gen4, was wir angesichts der Ryzen 3000 (Matisse) mit PCIe Gen4 schade finden.

Ob und welche Änderungen abseits der FP64-Leistung und der verdoppelten Datentransfer-Rate durch vier Stacks am Vega 20 vorgenommen wurden, darüber schweigt AMD. Auf Nachfrage nannte der Hersteller verbesserte Akkumulatoren, womit üblicherweise die Register der Shader-Einheiten gemeint sind. Denkbar ist, dass AMD diese vergrößert hat, um die Datenlokalität zu erhöhen. Generelle Optimierungen betreffen Anpassungen für einen leicht gestiegenen Chiptakt und geringere Latenzen, wobei hier unklar ist, welche genau. Laut Hersteller soll die Radeon VII unter Last grob 200 MHz schneller rechnen als eine luftgekühlte Radeon RX Vega 64 im Referenz-Design. Custom-Designs laufen leicht flotter, mehr als fünf Prozent sind aber selten.

Mit 64 statt 32 Sensoren misst Vega 20 laut AMD die anliegende Temperatur der einzelnen GPU-Bestandteile genauer als Vega 10. Die so ermittelte Junction Temperature ist an sich nicht neu, wurde aber bisher nur als Schwellenwert zur Notabschaltung herangezogen. Bei der Radeon VII verwendet AMD die Informationen, um die Leistung ein kleines bisschen zu steigern, weil kritische Funktionsblöcke näher an ihrem Limit betrieben werden können. In der Praxis limitiert allerdings zumeist das Power-Target des Grafikchips oder aber die Radeon Software im CPU-Limit in niedrigen Auflösungen wie 1080p.

Der Decode/Encode-Teil des Vega 20 ist weiterhin der bekannte UVD respektive VCE und nicht der neuere VCN (Video Core Next). Damit geht einher, dass die Radeon VII kein VP9 in Hardware per fest verdrahteten Einheiten decodiert/encodiert, sondern die Shader bemühen muss. Das klappt zwar auch in 4K60 flüssig, aber eben auf Kosten der Leistungsaufnahme. Zur Erinnerung: Google nutzt VP9 für Youtube. Laut Linux-Patches enthält die Vega 20 zwei Decode-Blöcke, was sinnvoll für Fotos und Videos ist, in denen Gesichter oder Objekte identifiziert sowie klassifiziert werden sollen.

 Die Radeon VII im DetailEs reicht für Nvidias RTX 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Top-Angebote
  1. (u. a. Kingston A400 480 GB für 41,90€ statt 50,10€ im Vergleich, Fractal Design Define R6 USB...
  2. (heute u. a. mit Serienboxen)
  3. 179,99€ (Vergleichspreis 219€)
  4. (u. a. Overwatch GOTY XBO für 15€ und Blu-ray-Angebote)

Shrimpy 20. Feb 2019

Bis jetzt hat jeder GCN von seinem "zu großen" speicher profitiert. Vega 7 hier wird es...

Mimimimimi 17. Feb 2019

Wenn du alles so toll weißt - warum fragst du dann noch hier? Dann empfehle ihn doch...

Anonymer Nutzer 12. Feb 2019

Eine wichtige Kleinigkeit ist beim Test übersehen worden. Offensichtlich hat AMD bei...

Neuro-Chef 11. Feb 2019

Oder einfach eine Distribution mit immer aktueller Software zu verwenden.

Entchen 09. Feb 2019

Also wenn man das Potential von Cb hernimmt, landet man irgendwo bei gut 200W herum, was...


Folgen Sie uns
       


Lenovo Thinkbook 13s - Test

Das Thinkbook wirkt wie eine Mischung aus teurem Thinkpad und preiswerterem Ideapad. Das klasse Gehäuse und die sehr gute Tastatur zeigen Qualität, das Display und die Akkulaufzeit sind die Punkte, bei denen gespart wurde.

Lenovo Thinkbook 13s - Test Video aufrufen
IT-Arbeit: Was fürs Auge
IT-Arbeit
Was fürs Auge

Notebook, Display und Smartphone sind für alle, die in der IT arbeiten, wichtige Werkzeuge. Damit man etwas mit ihnen anfangen kann, ist ein anderes Werkzeug mindestens genauso wichtig: die Augen. Wir geben Tipps, wie man auch als Freiberufler augenschonend arbeiten kann.
Von Björn König

  1. Sysadmin "Man kommt erst ins Spiel, wenn es brennt"
  2. Verdeckte Leiharbeit Wenn die Firma IT-Spezialisten als Fremdpersonal einsetzt
  3. IT-Standorte Wie kann Leipzig Hypezig bleiben?

OKR statt Mitarbeitergespräch: Wir müssen reden
OKR statt Mitarbeitergespräch
Wir müssen reden

Das jährliche Mitarbeitergespräch ist eines der wichtigsten Instrumente für Führungskräfte, doch es ist gerade in der IT-Branche nicht mehr unbedingt zeitgemäß. Aus dem Silicon Valley kommt eine andere Methode: OKR. Sie erfüllt die veränderten Anforderungen an Agilität und Veränderungsbereitschaft.
Von Markus Kammermeier

  1. Arbeit Hilfe für frustrierte ITler
  2. IT-Arbeitsmarkt Jobgarantie gibt es nie
  3. IT-Fachkräftemangel Freie sind gefragt

Schienenverkehr: Die Bahn hat wieder eine Vision
Schienenverkehr
Die Bahn hat wieder eine Vision

Alle halbe Stunde von einer Stadt in die andere, keine langen Umsteigezeiten zur Regionalbahn mehr: Das verspricht der Deutschlandtakt der Deutschen Bahn. Zu schön, um wahr zu werden?
Eine Analyse von Caspar Schwietering

  1. DB Navigator Deutsche Bahn lädt iOS-Nutzer in Betaphase ein
  2. One Fiber EWE will Bahn mit bundesweitem Glasfasernetz ausstatten
  3. VVS S-Bahn-Netz der Region Stuttgart bietet vollständig WLAN

    •  /