Abo
  • Services:

Deep Learning: AMDs Radeon Instinct erscheinen im Herbst 2017

Drei Modelle im dritten Quartal: Die für Deep Learning gedachten Beschleuniger, die Radeon Instinct, liefern eine hohe FP32-/FP16-Leistung für Training und Inference. Die Vega-basierte Variante darf sich bis zu 300 Watt genehmigen.

Artikel veröffentlicht am ,
Eine Radeon Instinct
Eine Radeon Instinct (Bild: AMD)

AMD hat sich auf dem Epyc Tech Day erneut zu den Radeon Instinct geäußert. Die im Dezember 2016 angekündigten Rechenkarten sollen im dritten Quartal 2017 an Technologiepartner ausgeliefert werden. AMD hat auch die bisher nur rudimentär bekannten Spezifikationen der Modelle offengelegt. Gedacht sind die Beschleuniger für Training und Inference bei Deep Learning.

  • Drei Radeon Instinct für Training und Inference (Bild: AMD)
  • Radeon Instinct MI25 (Bild: AMD)
  • Radeon Instinct MI8 (Bild: AMD)
  • Radeon Instinct MI6 (Bild: AMD)
Drei Radeon Instinct für Training und Inference (Bild: AMD)
Stellenmarkt
  1. BWI GmbH, München, Nürnberg, Rheinbach
  2. BWI GmbH, Nürnberg, München, Berlin oder Rheinbach

Drei Varianten der Radeon Instinct soll es geben: die MI25, die MI8 und die MI6. MI steht für Machine Intelligence, die Zahl gibt grob gerundet die theoretische Rechenleistung bei halber Genauigkeit (Half Precision, FP16) an. Dieser Wert ist relevant für Inference, also das Anwenden eines vorher trainierten neuronalen Netzes. Zumindest die Radeon Instinct MI25 unterstützt ein Viertel Genauigkeit (Quarter Precision, INT8) bei doppelter FP16-Geschwindigkeit, was für Inference oft ausreicht und bei Nvidia-Karten typisch ist.

Bei der Radeon Instinct MI25 handelt es sich um einen Beschleuniger, der AMDs neuen Vega-10-Chip nutzt. Der Vollausbau mit 4.096 Shader-Einheiten liefert eine Rechenleistung von 12,3 Teraflops (FP32) und 24,6 Teraflops (FP16). Die Datentransferrate beläuft sich dank 16 GByte HBM2-Videospeicher auf 484 GByte die Sekunde. AMD nennt eine Verlustleistung von 300 Watt - das reicht für 82 Gigaflops sowie 41 Gigaflops pro Watt. Verglichen mit der Nvidia Tesla V100 ist die MI25 zwar langsamer, sie dürfte aber günstiger werden. Wichtiges Detail: Die FP64-Leistung von Vega 10 liegt nur bei 1/16 von FP32.

1x Fiji und 1x Polaris

Zumindest bei einfacher Genauigkeit (Single Precision, FP32) ist die Radeon Instinct MI8 daher etwas effizienter. Sie basiert auf einem Fiji-Chip mit ebenfalls 4.096 Rechenkernen. Aufgrund von deutlich weniger GPU-Takt und älterer Architektur erreicht sie nur 8,2 Teraflops - egal ob FP32 oder FP16. Die Karte nutzt 4 GByte HBM1-Speicher mit 512 GByte die Sekunde, die Board-Power liegt wie bei der Nano bei 175 Watt. Umgerechnet sind das 47 Gigaflops pro Watt.

Die Radeon Instinct MI6 setzt wie die Radeon RX 580/570 auf den aktuellen Polaris-20-Chip mit 2.304 Shader-Einheiten und ein 256 Bit breites Interface mit gleich 16 GByte GDDR5-Videospeicher. Sie schafft 5,7 Teraflops (FP32 wie FP16) und damit 38 Gigaflops pro Watt. Die Karte benötigt 150 Watt, daher reicht anders als bei der MI25 und der MI6 eine Single-Slot-Kühlung.

Wie bei solchen Karten üblich fehlen jegliche Display-Ausgänge, und es gibt keinen eigenen Lüfter. Stattdessen pusten die Propeller des Server-Racks durch den Radiator auf den an der I/O-Blende offenen Beschleunigern. Neue Deep-Learning-Benchmarks gab es übrigens nicht.

Offenlegung: AMD hat die Reisekosten nach Austin für Golem.de übernommen.



Anzeige
Top-Angebote
  1. 99,00€ (lieferbar ab 1. April, versandkostenfrei)
  2. 99,00€ (zzgl. 1,99€ Versand)
  3. (u. a. Bis zu 33% Rabatt auf iPhone 6 Ersatzteile)
  4. (u. a. Spider-Man Homecoming, Wonder Woman)

felix.schwarz 21. Jun 2017

Es gibt in der Tat mehrere Entwickler (nicht direkt von AMD), die daran arbeiten...

gaciju 21. Jun 2017

GV100 hat keine doppelte FP16 Rate, also auch keine 30 TF sondern "nur" 15 32-Bit TF...

Neutrinoseuche 21. Jun 2017

So viel Ironie ist da am Ende gar nicht drin. Wenn man sie mit dem Antminer vergleicht...

johnmcwho 20. Jun 2017

Ich muss mal danke sagen, denn gegenüber anderen Medien habt ihr als letzten Satz klar...


Folgen Sie uns
       


Intel NUC8 (Crimson Canyon) - Test

Der NUC8 alias Crimson Canyon ist der erste Mini-PC mit einem 10-nm-Chip von Intel. Dessen Grafikeinheit ist aber deaktiviert, weshalb Intel noch eine Radeon RX 540 verlötet. Leider steckt im System eine Festplatte, weshalb der NUC8 sehr träge reagiert und vergleichsweise laut wird.

Intel NUC8 (Crimson Canyon) - Test Video aufrufen
Uploadfilter: Voss stellt Existenz von Youtube infrage
Uploadfilter
Voss stellt Existenz von Youtube infrage

Gut zwei Wochen vor der endgültigen Abstimmung über Uploadfilter stehen sich Befürworter und Gegner weiter unversöhnlich gegenüber. Verhandlungsführer Voss hat offenbar kein Problem damit, wenn es Plattformen wie Youtube nicht mehr gäbe. Wissenschaftler sehen hingegen Gefahren durch die Reform.

  1. Uploadfilter Koalition findet ihren eigenen Kompromiss nicht so gut
  2. Uploadfilter Konservative EVP will Abstimmung doch nicht vorziehen
  3. Uploadfilter Spontane Demos gegen Schnellvotum angekündigt

Tom Clancy's The Division 2 im Test: Richtig guter Loot-Shooter
Tom Clancy's The Division 2 im Test
Richtig guter Loot-Shooter

Ubisofts neuer Online-Shooter beweist, dass komplexe Live-Spiele durchaus von Anfang an überzeugen können. Bis auf die schwache Geschichte und Gegner, denen selbst Dauerbeschuss kaum etwas anhaben kann, ist The Division 2 ein spektakuläres Spiel.
Von Jan Bojaryn

  1. Netztest Connect Netztest urteilt trotz Funklöchern zweimal sehr gut
  2. Netztest Chip verteilt viel Lob trotz Funklöchern

Security: Vernetzte Autos sicher machen
Security
Vernetzte Autos sicher machen

Moderne Autos sind rollende Computer mit drahtloser Internetverbindung. Je mehr davon auf der Straße herumfahren, desto interessanter werden sie für Hacker. Was tun Hersteller, um Daten der Insassen und Fahrfunktionen zu schützen?
Ein Bericht von Dirk Kunde

  1. Alarmsysteme Sicherheitslücke ermöglicht Übernahme von Autos
  2. Netzwerkanalyse Wireshark 3.0 nutzt Paketsniffer von Nmap
  3. Sicherheit Wie sich "Passwort zurücksetzen" missbrauchen lässt

    •  /