Abo
  • IT-Karriere:

Radeon Instinct: AMD plant Beschleunigerkarten für Deep Learning

Geht es nach AMD, wird Nvidia im Deep-Learning-Segment bald überholt werden. Dafür sorgen sollen die neuen Radeon Instinct, darunter ein Modell mit der neuen Vega-Architektur, und die offene MI-Open-Software.

Artikel veröffentlicht am ,
Raja Koduri mit Radeon Instinct MI25
Raja Koduri mit Radeon Instinct MI25 (Bild: Marc Sauter/Golem.de)

AMD hat auf dem Tech Summit im kalifornischen Sonoma seine Strategie für Deep Learning und Machine Intelligence erläutert. Grafikchef Raja Koduri sagte vor Ort, AMD werde die nächsten fünf Jahre gewinnen - passend dazu zeigte er einen Benchmark, bei dem schon der mittlere der kommenden Beschleuniger Nvidias Topmodell Titan X (Pascal-basiert) schlägt. AMD hat sich schon früher mit Machine Intelligence beschäftigt, etwa 2008 mit einer AI-Demo namens Froblins die Wegfindung auf der GPU berechnet.

  • Raja Koduri mit Radeon Instinct MI25 (Foto: Marc Sauter/Golem.de)
  • Die drei MI-Karten (Bild: AMD)
  • Radeon Instinct setzt auf MI-Open, basierend auf ROCm. (Bild: AMD)
  • In Deep Bench GEMM schlägt die MI25 eine Titan X überdeutlich. (Bild: AMD)
  • Die MI-Beschleuniger arbeiten unter anderem mit Naples zusammen. (Bild: AMD)
Die drei MI-Karten (Bild: AMD)
Stellenmarkt
  1. mWGmy World Germany GmbH, Köln
  2. Information und Technik Nordrhein-Westfalen (IT.NRW), Düsseldorf

Grundlage für Deep Learning bei AMD ist eine neue Produktlinie von Beschleunigerkarten, die Radeon Instinct heißen. Drei Modelle sollen im ersten Halbjahr 2017 erscheinen: Die Radeon Instinct MI6 auf Polaris-Basis erreicht 5,7 Teraflops bei der für das Training und Inference relevanten Rechenleistung bei halber Genauigkeit (Half Precision, FP16). Es handelt sich also um eine Karte ähnlich der Radeon RX 480 oder Radeon Pro WX 7100. Die Radeon Instinct MI8 entspricht einer Radeon R9 Nano mit Fiji-Grafikchip und liefert 8,2 Teraflops. Die Radeon Instinct MI25 mit Vega-Architektur schafft 25 Teraflops.

Wer sich über den Sprung zwischen MI8 und MI25 wundert: Die Vega-Architektur beinhaltet Verbesserungen (siehe Playstation 4 Pro), darunter die Funktion, zwei FP16-Operationen statt einem FP32-Befehl pro Takt auszuführen. Polaris und Fiji können das nicht, ihre FP16-Rate entspricht daher der FP32-Geschwindigkeit. Der Vollständigkeit halber sei erwähnt, dass MI abkürzend für Machine Intelligence steht und zusammen mit der gerundeten FP16-Leistung den Namen der Radeon Instinct ergibt. Weitere Informationen zur MI25 und Vega haben wir in einem Artikel zusammengefasst.

Da Hardware ohne Software nutzlos ist, hat AMD eine Deep-Learning-Bibliothek entwickelt, die MI-Open heißt. Die Bibliothek setzt auf die Radeon Open Compute (ROCm) Platform, die ebenfalls quelloffen ist. MI-Open bildet die Basis für Frameworks wie Caffe oder Tensor Flow, mit denen wiederum die entsprechenden Deep-Learning-Anwendungen umgesetzt werden sollen. Eine erste Implementierung im Deep Bench sieht schon die Radeon Instinct MI8 bei einer GEMM-Messung vor Nvidias aktueller Titan X und die Radeon Instinct MI25 liegt mit fast 50 Prozent Abstand in Front. Aufgrund unbekannter Matrizengröße ist dieser Vergleich allerdings ziemlich irreführend.

  • Raja Koduri mit Radeon Instinct MI25 (Foto: Marc Sauter/Golem.de)
  • Die drei MI-Karten (Bild: AMD)
  • Radeon Instinct setzt auf MI-Open, basierend auf ROCm. (Bild: AMD)
  • In Deep Bench GEMM schlägt die MI25 eine Titan X überdeutlich. (Bild: AMD)
  • Die MI-Beschleuniger arbeiten unter anderem mit Naples zusammen. (Bild: AMD)
In Deep Bench GEMM schlägt die MI25 eine Titan X überdeutlich. (Bild: AMD)

AMD plant, zusammen mit Partnern wie Inventec und Supermicro Racks zu entwickeln, in denen bis zu 25 Beschleuniger vom Typ Radeon Instinct MI25 mit dem kommenden Naples-Prozessor mit 32 Zen-Kernen kombiniert werden. Ein solches System kommt auf bis zu 3 Petaflops bei halber Genauigkeit.



Anzeige
Spiele-Angebote
  1. (-12%) 52,99€
  2. 17,99€
  3. 12,99€
  4. 69,99€ (Release am 21. Februar 2020, mit Vorbesteller-Preisgarantie)

ms (Golem.de) 12. Dez 2016

Siehe unten ROCm den Punkt HIP, womit CUDA in C++ übersetzt wird.

c3rl 12. Dez 2016

https://scr3.golem.de/screenshots/1612/AMD-Radeon-Instinct/AMD-Radeon-Instinct-03.png


Folgen Sie uns
       


FX Tec Pro 1 - Hands on

Das Pro 1 von FX Tec ist ein Smartphone mit eingebauter Hardware-Tastatur. Der Slide-Mechanismus macht im ersten Kurztest von Golem.de einen sehr guten Eindruck.

FX Tec Pro 1 - Hands on Video aufrufen
Change-Management: Die Zeiten, sie, äh, ändern sich
Change-Management
Die Zeiten, sie, äh, ändern sich

Einen Change zu wollen, gehört heute zum guten Ton in der Unternehmensführung. Doch ein erzwungener Wandel in der Firmenkultur löst oft keine Probleme und schafft sogar neue.
Ein Erfahrungsbericht von Marvin Engel

  1. IT-Jobs Der Amtsschimmel wiehert jetzt agil
  2. MINT Werden Frauen überfördert?
  3. Recruiting Wenn das eigene Wachstum zur Herausforderung wird

Alexa: Das allgegenwärtige Ohr Amazons
Alexa
Das allgegenwärtige Ohr Amazons

Die kürzlich angekündigten Echo-Produkte bringen Amazons Sprachassistentin Alexa auf die Straße und damit Datenschutzprobleme in die U-Bahn oder in bisher Alexa-freie Wohnzimmer. Mehrere Landesdatenschutzbeauftragte haben Golem.de erklärt, ob und wie die Geräte eingesetzt werden dürfen.
Von Moritz Tremmel

  1. Digitaler Assistent Amazon bringt neue Funktionen für Alexa
  2. Echo Frames und Echo Loop Amazon zeigt eine Brille und einen Ring mit Alexa
  3. Alexa Answers Nutzer smarter Lautsprecher sollen Alexa Wissen beibringen

Gemini Man: Überflüssiges Klonexperiment
Gemini Man
Überflüssiges Klonexperiment

Am 3. Oktober kommt mit Gemini Man ein ambitioniertes Projekt in die deutschen Kinos: Mit HFR-Projektion in 60 Bildern pro Sekunde und Will Smith, der gegen sein digital verjüngtes Ebenbild kämpft, betreibt der Actionfilm technisch viel Aufwand. Das Seherlebnis ist jedoch bestenfalls komisch.
Von Daniel Pook

  1. Filmkritik Apollo 11 Echte Mondlandung als packende Kinozeitreise

    •  /