Abo
  • IT-Karriere:

Vega 20 ist für HPC gedacht

Die Radeon VII basiert auf dem Vega 20 genannten Grafikchip, welcher auf den Vega 10 der Radeon RX Vega 64/56 folgt. Die GPU wurde ursprünglich für die Radeon Instinct MI60/MI50 entwickelt, also die beiden AMD-Beschleunigerkarten für High Performance Computing (HPC) wie Klimaforschung und für maschinelles Lernen. Der Name der Karte rührt von ihrer Geschwindigkeit bei reduzierter Ganzzahl-Genauigkeit (INT8) her, die um ein Vierfaches höher liegt als bei gewöhnlichen FP32-Berechnungen. Mit FP16-Gleitkomma schaffen Vega 10/20 immer noch die doppelte Leistung der einfachen Genauigkeit.

Stellenmarkt
  1. Horváth & Partners Management Consultants, Stuttgart
  2. Wirecard Issuing Technologies GmbH, Aschheim/München

Im vierten Quartal 2018 konnte AMD einen Rekordumsatz im Bereich der Server-GPUs erzielen, sprich - die beiden Radeon Instinct scheinen sich oft zu verkaufen und offenbar sind sie auch in ausreichender Stückzahl verfügbar. Das spricht dafür, dass TSMCs N7-Fertigungsverfahren eine gute Ausbeute aufweist, denn alle Vega 20 werden in diesem 7-nm-DUV-Node hergestellt. Die Tatsache, dass AMD noch Chips für einige Radeon VII abzweigen kann, statt alle für die viel Margen-trächtigeren Radeon Instinct zu verwenden, untermauert diese Annahme. Ein bisschen Verschnitt gibt es aber immer, weshalb die Radeon VII nur 60 Compute Units aufweist, der Vollausbau mit 64 CUs ist der Radeon Instinct MI60 vorbehalten.

  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte, Seasonic Prime Titanium 1000W; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • Core i9-9900K, 16 GByte; Win10 x64 v1809, Geforce 417.71, Radeon Software 19.1.2 (Bild: Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • AMDs Radeon VII (Bild: Marc Sauter/Golem.de)
  • Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)
  • Die Radeon VII hat eine 1:4-Geschwindigkeit für FP64 (Bild: Marc Sauter/Golem.de)
Vega 20 der Radeon VII (Bild: Marc Sauter/Golem.de)

Ausgehend von Vega 10 steigt die Transistor-Anzahl bei Vega 20 kaum: Statt 12,5 Milliarden sind es 13,2 Milliarden und die Chipgröße verringert sich von 495 mm² auf 331 mm². Das N7-Verfahren nutzte AMD primär um ein vorhandenes Design für den HPC-Markt anzupassen: Vega 20 verdoppelt das Interface auf 4.096 Bit und bindet vier HBM2-Speicherstapel mit je 4 GByte für insgesamt 16 GByte an - bei Vega 10 sind es 2.048 Bit für zwei Stacks und 8 GByte; die Bandbreite verdoppelt sich also. Denkbar wären für eine Radeon Instinct MI60 auch gleich 32 GByte wie bei Nvidias Tesla V100, die hat aber auch mehr Rechenleistung. Ein eigenes Package spendiert AMD der Radeon VII vermutlich deshalb nicht, weil vier Stacks mit je zwei GByte eine eigene und somit teure Fertigung erfordern würde. Detail am Rande: Weil anders als bei Nvidia die ROPS vom Interface entkoppelt sind, hat Vega 20 wie Vega 10 auch 64 Raster-Endstufen statt gleich 128, welche in den meisten Anwendungen aber ohnehin nicht limitieren.

Vega 10 (MI25 / Vega 64)Vega 20 (MI60)Vega 20 (Radeon VII)
Fertigungsverfahren14LPP (GloFo)N7 (TSMC)N7 (TSMC)
Die-Size495 mm²331 mm²331 mm²
Transistoren12,5 Milliarden13,2 Milliarden13,2 Milliarden
Compute Units646460
Shader ALUs4.0964.0963.840
FP64ja, 1:16ja, 1:2ja, 1:4
FP16ja, 2:1ja, 2:1ja, 2:1
INT8ja, 4:1ja, 4:1(?)
INT4neinja, 8:1(?)
Textur-Einheiten256256240
Raster-Endstufen646464
Interface2.048 Bit4.096 Bit4.096 Bit
L2-Cache4 MByte4 MByte (?)4 MByte (?)
Videospeicher8 GByte HBM216 GByte HBM216 GByte HBM2
AnbindungPCIe Gen3 x16PCIe Gen4 x16PCIe Gen3 x16
Technische Daten von AMDs Vega-GPUs

Um die Radeon Instinct MI50 preislich von der Radeon VII abzugrenzen, hat AMD die Consumer-Karte um ein paar Funktionen beschnitten: Auch wenn der Vega 20 prinzipiell ein 1:2-Verhältnis von FP64-zu-FP32-Leistung aufweist, schaltet der Hersteller eine 1:4-Ratio frei. Das ist das Vierfache einer Radeon RX Vega 64 mit Vega 10 und das Achtfache (!) dessen, was Nvidia bei seinen Geforce-RTX-Modellen bereitstellt. Auch unterstützt Vega 20 anders als Vega 10 schnelle INT8-Berechnungen für Inferencing, was bei der Radeon VII offenbar aktiviert ist. Eine weitere Änderung ist die Anbindung an die CPU, hier unterstützt die Radeon VII aber nur PCIe Gen3 statt PCIe Gen4, was wir angesichts der Ryzen 3000 (Matisse) mit PCIe Gen4 schade finden.

Ob und welche Änderungen abseits der FP64-Leistung und der verdoppelten Datentransfer-Rate durch vier Stacks am Vega 20 vorgenommen wurden, darüber schweigt AMD. Auf Nachfrage nannte der Hersteller verbesserte Akkumulatoren, womit üblicherweise die Register der Shader-Einheiten gemeint sind. Denkbar ist, dass AMD diese vergrößert hat, um die Datenlokalität zu erhöhen. Generelle Optimierungen betreffen Anpassungen für einen leicht gestiegenen Chiptakt und geringere Latenzen, wobei hier unklar ist, welche genau. Laut Hersteller soll die Radeon VII unter Last grob 200 MHz schneller rechnen als eine luftgekühlte Radeon RX Vega 64 im Referenz-Design. Custom-Designs laufen leicht flotter, mehr als fünf Prozent sind aber selten.

Mit 64 statt 32 Sensoren misst Vega 20 laut AMD die anliegende Temperatur der einzelnen GPU-Bestandteile genauer als Vega 10. Die so ermittelte Junction Temperature ist an sich nicht neu, wurde aber bisher nur als Schwellenwert zur Notabschaltung herangezogen. Bei der Radeon VII verwendet AMD die Informationen, um die Leistung ein kleines bisschen zu steigern, weil kritische Funktionsblöcke näher an ihrem Limit betrieben werden können. In der Praxis limitiert allerdings zumeist das Power-Target des Grafikchips oder aber die Radeon Software im CPU-Limit in niedrigen Auflösungen wie 1080p.

Der Decode/Encode-Teil des Vega 20 ist weiterhin der bekannte UVD respektive VCE und nicht der neuere VCN (Video Core Next). Damit geht einher, dass die Radeon VII kein VP9 in Hardware per fest verdrahteten Einheiten decodiert/encodiert, sondern die Shader bemühen muss. Das klappt zwar auch in 4K60 flüssig, aber eben auf Kosten der Leistungsaufnahme. Zur Erinnerung: Google nutzt VP9 für Youtube. Laut Linux-Patches enthält die Vega 20 zwei Decode-Blöcke, was sinnvoll für Fotos und Videos ist, in denen Gesichter oder Objekte identifiziert sowie klassifiziert werden sollen.

 Die Radeon VII im DetailEs reicht für Nvidias RTX 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de
  2. 259€ + Versand oder kostenlose Marktabholung (aktuell günstigste GTX 1070 Mini)
  3. 177,90€ + Versand (Bestpreis!)

Shrimpy 20. Feb 2019

Bis jetzt hat jeder GCN von seinem "zu großen" speicher profitiert. Vega 7 hier wird es...

Mimimimimi 17. Feb 2019

Wenn du alles so toll weißt - warum fragst du dann noch hier? Dann empfehle ihn doch...

nixidee 12. Feb 2019

Eine wichtige Kleinigkeit ist beim Test übersehen worden. Offensichtlich hat AMD bei...

Neuro-Chef 11. Feb 2019

Oder einfach eine Distribution mit immer aktueller Software zu verwenden.

Entchen 09. Feb 2019

Also wenn man das Potential von Cb hernimmt, landet man irgendwo bei gut 200W herum, was...


Folgen Sie uns
       


Speedport Pro - Test

Der Speedport Pro ist gerade im WLAN verglichen mit dem älteren Speedport Hybrid eine Verbesserung. Allerdings zeigt sich in unserem Test auch, dass die maximale Datenrate nicht steigt. Eher das Gegenteil ist der Fall.

Speedport Pro - Test Video aufrufen
Chromium: Der neue Edge-Browser könnte auch Chrome besser machen
Chromium
Der neue Edge-Browser könnte auch Chrome besser machen

Build 2019 Wie sieht die Zukunft des Edge-Browsers aus und was will Microsoft zum Chromium-Projekt beitragen? Im Gespräch mit Golem.de gibt das Unternehmen die vage Aussicht auf einen Release für Linux und Verbesserungen in Google Chrome. Bis dahin steht viel Arbeit an.
Von Oliver Nickel

  1. Browser Edge auf Chromium-Basis wird Netflix in 4K unterstützen
  2. Browser Microsoft lässt nur Facebook auf Flash-Whitelist in Edge
  3. Microsoft-Browser Edge bekommt Chromium-Herz

Motorola One Vision im Hands on: Smartphone mit 48-Megapixel-Kamera für 300 Euro
Motorola One Vision im Hands on
Smartphone mit 48-Megapixel-Kamera für 300 Euro

Motorola bringt ein weiteres Android-One-Smartphone auf den Markt. Die Neuvorstellung verwendet viel Samsung-Technik und hat ein sehr schmales Display. Die technischen Daten sind für diese Preisklasse vielversprechend.
Ein Hands on von Ingo Pakalski

  1. Moto G7 Power Lenovos neues Motorola-Smartphone hat einen großen Akku
  2. Smartphones Lenovo leakt neue Moto-G7-Serie

Katamaran Energy Observer: Kaffee zu kochen heißt, zwei Minuten später anzukommen
Katamaran Energy Observer
Kaffee zu kochen heißt, zwei Minuten später anzukommen

Schiffe müssen keine Dreckschleudern sein: Victorien Erussard und Jérôme Delafosse haben ein Boot konstruiert, das ohne fossilen Treibstoff auskommt. Es kann sogar auf hoher See selbst Treibstoff aus Meerwasser gewinnen. Auf ihrer Tour um die Welt wirbt die Energy Observer für erneuerbare Energien.
Ein Bericht von Werner Pluta

  1. Umweltschutz Kanäle in NRW bekommen Ladesäulen für Binnenschiffe
  2. Transport DLR plant Testfeld für autonome Schiffe in Brandenburg
  3. C-Enduro Britische Marine testet autonomes Wasserfahrzeug

    •  /