• IT-Karriere:
  • Services:

SX-10 Aurora Tsubasa: NECs Beschleuniger nutzt sechs HBM2-Stacks

Vektorkarte statt Intels Xeon Phi oder Nvidias Tesla: NEC zeigt mit dem SX-Aurora Tsubasa einen Rechner für Supercomputer, der eine sehr hohe Leistung liefert. Das Topmodell ist wassergekühlt, drei Varianten sollen Anfang 2018 erscheinen.

Artikel veröffentlicht am ,
NECs SX-10 Aurora Tsubasa
NECs SX-10 Aurora Tsubasa (Bild: Nikkei)

NEC hat weitere Details zum SX-10 Aurora Tsubasa verraten, einem Beschleuniger für unter anderem Supercomputer. Das berichtet die c't von der Supercomputing 2017, einer HPC-Konferenz (High Performance Computing) in Denver. NEC hatte die SX-10 Aurora Tsubasa im Oktober 2017 vorgestellt und drei Modelle für verschiedene Systeme angekündigt. Tsubasa bedeutet Flügel und ist eine Anspielung auf Captain Tsubasa, ein Manga und Anime, der hierzulande als Die tollen Fußballstars ausgestrahlt wurde.

  • NECs SX-10 Aurora Tsubasa (Foto: c't)
  • NECs SX-10 Aurora Tsubasa (Foto: c't)
  • NECs SX-10 Aurora Tsubasa (Bild: Nikkei)
NECs SX-10 Aurora Tsubasa (Foto: c't)
Stellenmarkt
  1. Hannover Rück SE, Hannover
  2. WBS GRUPPE, deutschlandweit (Home-Office)

Die SX-10 Aurora Tsubasa sind PCIe-Karten, die in ein x86-Host-System gesteckt werden. Den drei Modellen gemein ist ein Chip mit acht Vektorkernen, der auf einem sehr großen Package sitzt und gleich sechs HBM2-Speicherstapel nutzt. Die wassergekühlte 10A-Variante schafft 2,46 Teraflops bei doppelter Genauigkeit (FP64) und verfügt über satte 48 GByte Kapazität mit 1,2 TByte die Sekunde an Bandbreite. Die kleineren Ableger schaffen 2,15 Teraflops und weisen langsamer taktenden HBM2 auf, die 10C-Karte hat zudem nur 24 GByte Speicher und eine Luftkühlung. Der längliche Vektorchip wird in einem 16-nm-Verfahren bei der TSMC gefertigt und misst 494 mm², die Beschleuniger benötigen laut Hersteller unter 300 Watt.

Eingesetzt werden sollen die SX-10 Aurora Tsubasa entweder einzeln in einer Workstation oder in Server-Blades mit zwei bis acht Beschleunigern oder in Supercomputer-Schränken mit gleich 64 der Karten. Als Host verwendet NEC einen oder zwei Xeon (Skylake-SP) der Gold- oder Silver-Reihe. Die SX-10 Aurora Tsubasa eignen sich vor allem für Berechnungen, die eine sehr hohe Bandbreite aber vergleichsweise wenig lokalen Speicher benötigen.

Vor einigen Jahren waren die früheren SX-6-Modelle für die enorme Leistung des Earth Simulator verantwortlich, der mit knapp 36 Teraflops (FP64) zweieinhalb Jahre lang die Liste der schnellsten Supercomputer anführte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. 555,55€ (zzgl. Versandkosten)
  2. (reduzierte Überstände, Restposten & Co.)

bla 22. Nov 2017

Bei 6 HBM2 Stapeln wäre das schon recht wenig. Laut dem Dokument sind es 1,2 TByte/s...

xmaniac 22. Nov 2017

...weil Vektor-Multiplikation ja so ein enormes Problem auf GPUs darstellt... *facepalm*


Folgen Sie uns
       


Pixel 4 XL - Test

Das Pixel 4 XL ist Googles erstes Smartphone mit einer Dualkamera. Im Test haben wir uns diese genau angeschaut.

Pixel 4 XL - Test Video aufrufen
Threadripper 3970X/3960X im Test: AMD wird uneinholbar
Threadripper 3970X/3960X im Test
AMD wird uneinholbar

7-nm-Fertigung, Zen-2-Architektur und dank Chiplet-Design keine Scheduler-Probleme unter Windows 10: AMDs Threadripper v3 überzeugen auf voller Linie, die CPUs wie die Plattform. Intel hat im HEDT-Segment dem schlicht nichts entgegenzusetzen. Einzig Aufrüster dürften sich ärgern.
Ein Test von Marc Sauter

  1. Via Technologies Centaur zeigt x86-Chip mit AI-Block
  2. Nuvia Apples Chip-Chefarchitekt gründet CPU-Startup
  3. Tiger Lake Intel bestätigt 10-nm-Desktop-CPUs

Mikrocontroller: Sensordaten mit Micro Python und ESP8266 auslesen
Mikrocontroller
Sensordaten mit Micro Python und ESP8266 auslesen

Python gilt als relativ einfach und ist die Sprache der Wahl in der Data Science und beim maschinellen Lernen. Aber die Sprache kann auch anders. Mithilfe von Micro Python können zum Beispiel Sensordaten ausgelesen werden. Ein kleines Elektronikprojekt ganz ohne Löten.
Eine Anleitung von Dirk Koller

  1. Programmiersprache Python verkürzt Release-Zyklus auf ein Jahr
  2. Programmiersprache Anfang 2020 ist endgültig Schluss für Python 2
  3. Micropython Das Pyboard D ist ein Steckbausatz für IoT-Bastler

Core i9-10980XE im Test: Intel rettet sich über den Preis
Core i9-10980XE im Test
Intel rettet sich über den Preis

Nur wenige Stunden vor AMDs Threadripper v3 veröffentlicht Intel den i9-10980XE: Der hat 18 Kerne und beschleunigt INT8-Code für maschinelles Lernen. Vor allem aber kostet er die Hälfte seines Vorgängers, weil der günstigere Ryzen 3950X trotz weniger Cores praktisch genauso schnell ist.
Ein Test von Marc Sauter

  1. Prozessoren Intel meldet 14-nm-Lieferprobleme
  2. NNP-T und NNP-I Intel hat den T-1000 der künstlichen Intelligenz
  3. Kaby Lake G Intels AMD-Chip wird eingestellt

    •  /