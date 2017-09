Der zweitstärkste Supercomputer der Welt, der Tianhe-2, wird aufgerüstet und leistet künftig fast doppelt so viele Petaflops. Das hat Kai Lu von der chinesischen NUDT (National University of Defense Technology) auf dem Supercomputer-Treffen IHPCF 2017 bekanntgegeben. Das überarbeitete System heißt Tianhe-2A und weist neben Verbesserungen wie mehr Speicher neue Beschleuniger auf. So erreicht der Supercomputer eine theoretische Rechenleistung von 94,97 Petaflops statt zuvor 54,9 Petaflops. Die Nummer 1 - der chinesische Sunway Taihu Light - schafft 125,44 Petaflops.

Anstatt bisher 16.000 Nodes stecken im Tianhe-2A nun aktualisierte 17.792 Nodes. Sie bestehen weiterhin aus Xeon-E5-CPUs von Intel und sind mit insgesamt 3,4 statt 1,4 Petabyte Arbeitsspeicher versehen. Statt Ivy-Bridge-EP-Prozessoren werden mindestens Haswell-EP-Prozessoren und anstelle von DDR3- wird DDR4-Speicher genutzt. Die bisherigen Xeon-Phi-Beschleuniger alias Knights Corner wurden durch Matrix 2000 ersetzt. Das sind GPDSPs (General Purpose Digital Signal Processors) mit einer Rechenleistung von 4,92 Teraflops bei einfacher (FP32) und 2,46 Teraflops bei doppelter (FP64) Genauigkeit. Die Beschleuniger arbeiten mit 256-Bit-Vektor-Einheiten und laufen mit 1,2 GHz.

Jeder Matrix-2000-GPDSP benötigt 240 Watt, was angesichts der Geschwindigkeit recht effizient ist. Der Tianhe-2A kommt auf rund 18 Megawatt und schafft über 5 Gigaflops pro Watt im Linpack-Benchmark. Bisher sind es 17,8 Megawatt und somit 1,96 Gigaflops pro Watt. Wichtig neben mehr Arbeitsspeicher und Storage ist der überarbeitete Interconnect, der mehr Durchsatz bei kürzeren Latenzen aufweist. Weitere Details gibt es auf dem Twitter-Account von James Lin, dem Vice Director des Center of HPC der Shanghai Jiao Tong University.

















Der Sunway Taihu Light ist neben dem Tianhe-2A nicht nur der schnellste Supercomputer der Welt. Beide Systeme verwenden keine Intel-Beschleuniger mehr, sondern chinesische Eigenentwicklung. Das US-amerikanische Energieministerium (Department of Energy) arbeitet derzeit am Aurora, am Sierra und am Summit mit jeweils über 200 Petaflops. Die Systeme nutzen teils IBMs Power9 und teils Intels Xeons und sind mit Beschleunigern aus den USA - Intels Xeon Phi oder Nvidia Tesla V100 - ausgestattet.