Abo
  • Services:

Knights Mill: Intels Xeon Phi hat 72 Kerne und etwas Netburst

Der nächste Xeon-Phi-Beschleuniger, Knights Mill, erhält überarbeitete Ausführungseinheiten, um mit doppelter Geschwindigkeit und halber Genauigkeit zu rechnen.

Artikel veröffentlicht am ,
Knights Mill
Knights Mill (Bild: Intel)

Intel hat auf der Hot Chips 29 im kalifornischen Cupertino über Knights Mill gesprochen. So heißt die nächste Generation Xeon Phi, also Rechenkarten für Server, die mittlerweile mit Fokus auf Deep-Learning-Training entwickelt wurden. Verglichen mit Knights Landing alias Xeon Phi 7200 wurden daher die Kerne umgebaut, damit sie auch mit halber Genauigkeit arbeiten können.

  • Knights Mill nutzt MCRAM und DDR4. (Bild: Intel)
  • Der Chip besteht erneut aus 36 Tiles und 72 Cores. (Bild: Intel)
  • Blockdiagamm eines KNM-Kerns (Bild: Intel)
  • Knights Mill erreicht doppelte FP32- und halbe FP64-Leistung, beherrscht aber auch INT16 mit vierfacher Geschwindigkeit. (Bild: Intel)
  • Möglich wird das durch vier FMAs pro Takt, ... (Bild: Intel)
  • ... die mit den passenden INT16-Instruktionen ... (Bild: Intel)
  • ... ideal für Training sind. (Bild: Intel)
  • KNL und KNM im Vergleich (Bild: Intel)
Der Chip besteht erneut aus 36 Tiles und 72 Cores. (Bild: Intel)
Stellenmarkt
  1. Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO, Stuttgart, Esslingen
  2. eco Verband der Internetwirtschaft e.V., Köln

Der grundlegende Aufbau bleibt oberflächlich gleich: Knights Mill besteht aus 36 Kacheln, die per Mesh-Struktur kommunizieren. Jede Tile besteht aus zwei Kernen sowie VPUs (Vector Processing Unit) mit ein MByte L2-Cache. Die Vektoreinheiten sind für die AVX-512-Instruktionen verantwortlich, die 72 Cores arbeiten zugunsten der Auslastung mit vierfachem Hyperthreading.

Für Deep Learning beherrschen die VPUs sogenanntes Quad FMA, also vier Multiplikationen zusammen mit einer Addition in einem Schritt mit einfacher Gleitkomma-Genauigkeit (FP32). Dadurch verdoppelt ("pumped" wie einst beim Pentium 4) sich die Geschwindigkeit pro Takt verglichen mit Knights Landing; weil aber einer der Double-Precision-Ports fehlt, halbiert sich die Leistung bei FP64. Stattdessen integrierte Intel vier der neuen VNNI-Einheiten.

  • Knights Mill nutzt MCRAM und DDR4. (Bild: Intel)
  • Der Chip besteht erneut aus 36 Tiles und 72 Cores. (Bild: Intel)
  • Blockdiagamm eines KNM-Kerns (Bild: Intel)
  • Knights Mill erreicht doppelte FP32- und halbe FP64-Leistung, beherrscht aber auch INT16 mit vierfacher Geschwindigkeit. (Bild: Intel)
  • Möglich wird das durch vier FMAs pro Takt, ... (Bild: Intel)
  • ... die mit den passenden INT16-Instruktionen ... (Bild: Intel)
  • ... ideal für Training sind. (Bild: Intel)
  • KNL und KNM im Vergleich (Bild: Intel)
Knights Mill erreicht doppelte FP32- und halbe FP64-Leistung, beherrscht aber auch INT16 mit vierfacher Geschwindigkeit. (Bild: Intel)

Etwas überraschend arbeiten die Virtual Neural Network Instructions nicht mit halber Gleitkomma-Genauigkeit (FP16), sondern mit variablem und weniger flexiblem Festpunkt-Format. Mit INT16-Eingabe und INT32-Ausgabe bei 31 Bit erreicht Intel aber genug Genauigkeit für das Training neuronaler Netze.

Bei angenommenen 1,5 GHz für 72 Cores wie bei Knights würde Knights Mill theoretisch folgende Rechenleistung erreichen: 13,8 statt 6,9 Teraflops bei einfacher Genauigkeit (FP32) und 1,7 statt 3,5 Teraflops bei doppelter Präzision (FP64) sowie 27,6 Terafops bei halber Genauigkeit (INT16).

Von den Kernen abgesehen gibt es bei Knights Mill keine Neuerungen. Der Chip wird mit 16 GByte MCRAM (modifizierte Hybrid Memory Cubes) auf dem Package kombiniert. Als gesockelte Version kann der Xeon Phi über sechs Speicherkanäle auf DDR4 zugreifen und weist 36 PCIe-Gen3-Lanes auf.



Anzeige
Blu-ray-Angebote
  1. (u. a. 3 Blu-rays für 15€, 2 Neuheiten für 15€)
  2. (u. a. Logan, John Wick, Alien Covenant, Planet der Affen Survival)

Cyber1999 23. Aug 2017

Jepp bei Alternate, aber das war auch mal anders, bei Amazon kann man die 7120P noch...

M.P. 22. Aug 2017

Ahh - gefunden:


Folgen Sie uns
       


Dark Rock Pro TR4 - Test

Der Dark Rock Pro TR4 von Be quiet ist einer der wenigen Luftkühler für AMDs Threadripper-Prozessoren. Im Test schneidet er sehr gut ab, da die Leistung hoch und die Lautheit niedrig ausfällt. Bei der Montage und der RAM-Kompatibilität gibt es leichte Abzüge, dafür ist der schwarze Look einzigartig.

Dark Rock Pro TR4 - Test Video aufrufen
Autonome Schiffe: Und abends geht der Kapitän nach Hause
Autonome Schiffe
Und abends geht der Kapitän nach Hause

Weite Reisen in ferne Länder, eine Braut in jedem Hafen: Klischees über die Seefahrt täuschen darüber hinweg, dass diese ein Knochenjob ist. Doch in wenigen Jahren werden Schiffe ohne Besatzung fahren, überwacht von Steuerleuten, die nach dem Dienst zur Familie zurückkehren. Daran arbeitet etwa Rolls Royce.
Ein Bericht von Werner Pluta

  1. Elektromobilität San Francisco soll ein Brennstoffzellenschiff bekommen
  2. Yara Birkeland Autonome Schiffe sind eine neue Art von Transportsystem
  3. Power Pac Strom aus dem Container für Ozeanriesen

Apple Mac Mini (Late 2018) im Test: Tolles teures Teil - aber für wen?
Apple Mac Mini (Late 2018) im Test
Tolles teures Teil - aber für wen?

Der Mac Mini ist ein gutes Gerät, wenngleich der Preis für die Einstiegsvariante von Apple arg hoch angesetzt wurde und mehr Speicher(platz) viel Geld kostet. Für 4K-Videoschnitt eignet sich der Mac Mini nur selten und generell fragen wir uns, wer ihn kaufen soll.
Ein Test von Marc Sauter

  1. Apple Mac Mini wird grau und schnell
  2. Neue Produkte Apple will Mac Mini und Macbook Air neu auflegen

Resident Evil 2 angespielt: Neuer Horror mit altbekannten Helden
Resident Evil 2 angespielt
Neuer Horror mit altbekannten Helden

Eigentlich ein Remake - tatsächlich aber fühlt sich Resident Evil 2 an wie ein neues Spiel: Golem.de hat mit Leon und Claire gegen Zombies und andere Schrecken von Raccoon City gekämpft.
Von Peter Steinlechner

  1. Resident Evil Monster und Mafia werden neu aufgelegt

    •  /