Xeon Phi: Knights Landing bietet 3 Teraflops, 16 GByte EDRAM und DDR4

17 der 500 Supercomputer der aktuellen Top 500 sind mit Xeon Phi ausgestattet, vor einem Jahr waren es nur zwölf - damit dieses Wachstum auch in Zukunft anhält, arbeitet Intel mit Knights Landing am bisher größten Sprung in der Geschichte der MIC-Architektur.
Die "Many Integrated Core"-Technik basiert auf der Larrabee-Idee und kombiniert eine Vielzahl kleiner x86-Prozessoren. Damit erreichen die als Xeon Phi vermarkteten Beschleunigerkarten vom Typ Knights Corner(öffnet im neuen Fenster) derzeit bis zu 1,2 Teraflops bei Double Precision (DP) - Knights Landing soll es auf über 3 Teraflops bringen.











Statt 62 kleiner Pentium- verbaut Intel älteren Meldungen(öffnet im neuen Fenster) zufolge 72 Silvermont -Kerne. Diese sind so modifiziert, dass sie (anders als Bay Trail) vier Threads per Hyperthreading abarbeiten und AVX-512(öffnet im neuen Fenster) beherrschen. Dadurch steigt die DP-Leistung auf 32 Flops pro Kern und Takt, für etwas über 3 Teraflops müsste Knights Landing also mit 1,3 GHz oder höher takten.
Da das Verhältnis aus Single und Double Precision 2:1 beträgt, erreichen die kommenden Xeon Phi zudem über 6 SP-Teraflops. Zum Vergleich: AMDs Firepro W9100(öffnet im neuen Fenster) bietet 5,2 und 2,6 Teraflops, während Nvidias K40 es auf 4,3 und 1,4 Teraflops bringt - Intels Lösung ist also teils mehr als doppelt so schnell.
On-Package-Speicher plus DDR4
Damit die Rechenleistung nicht verpufft und Knights Landing auch bei speicherlastigen Aufgaben gut dasteht, sind die Xeon Phi mit 16 GByte On-Package-Speicher in Form von Embedded-DRAM ausgestattet. Der soll wahnwitzige 500 GByte pro Sekunde an Daten übertragen und wird nicht im Die sitzen, sondern daneben auf dem Träger. Er dient als Cache oder als RAM.
Zudem bindet Knights Landing über sechs Speicherkanäle bis zu 384 GByte DDR4-2400 an, die jedoch nur ein Fünftel der Datenübertragungsrate des EDRAM erreichen sollen. Das spricht für ein 192-Bit-Speicherinterface, mit dem 115 GByte pro Sekunde möglich wären. Die aktuellen Knights Corner bieten nur 16 GByte GDDR5-Speicher mit bis zu 320 GByte/s.











Die vollen sechs Speicherkanäle kann Knights Landing allerdings nur nutzen, wenn der Chip nicht auf einer Beschleunigerkarte (hier sollen nur zwei Channels mit insgesamt 64 GByte DDR4 aktiv sein) sitzt, sondern als Host-Prozessor mit 36 PCIe-3.0-Lanes dient.
Bis Intel nächster Xeon Phi aber Supercomputer antreibt, wird es noch ein bis zwei Jahre dauern: Das erste System soll Mitte 2016 Nerscs Cori(öffnet im neuen Fenster) mit über 9.300 Knights Landings werden, einzelne Beschleuniger sollen im zweiten Halbjahr 2015 verfügbar sein. Hintergrund ist die 14-Nanometer-Fertigung von Intel, die schon bei den kleinen Broadwell -Chips nicht rund läuft.
Nachtrag vom 24. Juni 2014, 7:58 Uhr
Der auf früheren Folien genutzte Begriff MC-RAM und der Verweis auf Micron machten es bereits deutlich: Bei den 16 GByte On-Package-Speicher von Knights Landing handelt es sich um (Hybrid) Memory Cubes , dies bestätigte Micron den Kollegen von Eetimes(öffnet im neuen Fenster) .



