Abo
  • Services:

Knights Mill: Intels nächster Xeon Phi wird doppelt so schnell

Die als Knights Mill entwickelte nächste Generation von Intels Xeon-Phi-Prozessoren soll eine weitaus höhere Rechenleistung für Deep Learning aufweisen. Dazu setzt der Hersteller auf Operationen mit einfacher und halber Genauigkeit.

Artikel veröffentlicht am ,
Knights Mill ist für Deep Learning gedacht.
Knights Mill ist für Deep Learning gedacht. (Bild: Intel)

Intel hat auf der International Supercomputing 2017 in Frankfurt ein wenig über Knights Mill (KNM) gesprochen. Der Chip ist als ein für Steckkarten oder als gesockelter Prozessor gedachter Beschleuniger für Deep Learning vorgesehen. Knights Mill gehört zur Familie der Xeon Phi, nach Intels Zählung die dritte Generation nach Knights Landing und Knights Corner. Angekündigt wurde der neue Prozessor auf Intels Hausmesse IDF im August 2016.

  • Knights Mill ist die dritte Generation der Xeon Phi. (Bild: Intel)
Knights Mill ist die dritte Generation der Xeon Phi. (Bild: Intel)
Stellenmarkt
  1. Bosch Gruppe, Hildesheim
  2. Landeshauptstadt Stuttgart, Stuttgart

Die bisherigen KNL-Varianten wie das Topmodell Xeon Phi 7290 mit 72 (von theoretisch 76) Kernen schaffen eine Rechenleistung von bis zu 3,5 Teraflops doppelter Genauigkeit (Double Precision, FP64) und 7 Teraflops bei einfacher Genauigkeit (Single Precision, FP32). Knights Mill soll die SP-Geschwindigkeit verdoppeln, Hintergrund ist die neue QFMA-Instruktion, was für Quad Fused Multiply Add steht. Hinzu kommt QVNNI (Quad Virtual Neural Network Instruction), womit Intel die Option schafft, auch Berechnungen bei halber Genauigkeit (Half Precision, FP16 oder INT16) durchzuführen.

Somit liefert Knights Mill die Flexibilität, für Training und Inference bei Deep Learning über die notwendige Präzision zu verfügen. Gerade für ein bereits ausgebildetes neurales Netz würde aber auch eine noch geringere Genauigkeit ausreichen, weshalb Nvidia auch Beschleuniger mit INT8-Unterstützung anbietet. Die Xeon Phi entstammen aber eigentlich dem HPC-Segment (High Performance Computing), wie an der hohen FP64-Leistung erkennbar ist, die bei Deep Learning wenig hilft.

Intel erwartet, dass Knights Mill im vierten Quartal 2017 in die Serienfertigung geht - finale Prozessoren dürften daher vor 2018 nicht verfügbar sein. Somit erscheint Knights Hill, der mit der verspäteten 10-nm-Technik statt mit 14++ hergestellt wird, ziemlich wahrscheinlich erst 2019.



Anzeige
Blu-ray-Angebote
  1. 34,99€

nicoledos 21. Jun 2017

So schlecht sieht es für Intel nicht aus. Es zählt nicht nur die CPU, es kommt auf das...

Kunterbunt 20. Jun 2017

QFMA steht sowohl für Quad Fused Multiply Add, als auch für Quad Virtual Neural Network...


Folgen Sie uns
       


Two Point Hospital - Golem.de live

Dr. Dr. Golem meldet sich zum Dienst und muss im Livestream unfassbar viele depressive Clowns heilen, nein - nicht die im Chat.

Two Point Hospital - Golem.de live Video aufrufen
Oldtimer-Rakete: Ein Satellit noch - dann ist Schluss
Oldtimer-Rakete
Ein Satellit noch - dann ist Schluss

Ursprünglich sollte sie Atombomben auf Moskau schießen, dann kam sie in die Raumfahrt. Die Delta-II-Rakete hat am Samstag ihren letzten Flug.
Von Frank Wunderlich-Pfeiffer

  1. Stratolaunch Riesenflugzeug bekommt eigene Raketen
  2. Chang'e 4 China stellt neuen Mondrover vor
  3. Raumfahrt Cubesats sollen unhackbar werden

Fifa 19 und PES 2019 im Test: Knapper Punktsieg für EA Sports
Fifa 19 und PES 2019 im Test
Knapper Punktsieg für EA Sports

Es ist eher eine Glaubens- als eine echte Qualitätsfrage: Fifa 19 oder PES 2019? Golem.de zieht anhand der Versionen für Playstation 4 den Vergleich - und kommt zu einem schwierigen, aber eindeutigen Urteil.
Ein Test von Olaf Bleich und Benedikt Plass-Fleßenkämper

  1. Fifa 19 angespielt Präzisionsschüsse, Zweikämpfe und mehr Taktik
  2. EA Sports Fifa 18 bekommt kostenloses WM-Update
  3. Bestseller Fifa 18 schlägt Call of Duty in Europa

Grafikkarten: Das kann Nvidias Turing-Architektur
Grafikkarten
Das kann Nvidias Turing-Architektur

Zwei Jahre nach Pascal folgt Turing: Die GPU-Architektur führt Tensor-Cores und RT-Kerne für Spieler ein. Die Geforce RTX haben mächtige Shader-Einheiten, große Caches sowie GDDR6-Videospeicher für Raytracing, für Deep-Learning-Kantenglättung und für mehr Leistung.
Ein Bericht von Marc Sauter

  1. Tesla T4 Nvidia bringt Googles Cloud auf Turing
  2. Battlefield 5 mit Raytracing Wenn sich der Gegner in unserem Rücken spiegelt
  3. Nvidia Turing Geforce RTX 2080 rechnet 50 Prozent schneller

    •  /