• IT-Karriere:
  • Services:

CS-Storm 500GT/500NX: Crays Cluster nutzen FPGAs und Teslas

Gedacht zur Entwicklung von künstlicher Intelligenz: Die beiden CS-Storm-Cluster von Cray basieren auf Intels aktuellen Xeons und Nvidias Tesla P100 mit Pascal-Technik. Kunden haben Zugriff auf Broadwell- oder Skylake-CPUs und auf FPGAs.

Artikel veröffentlicht am ,
CS-Storm 500GT/500NX
CS-Storm 500GT/500NX (Bild: Cray)

Cray hat zwei sogenannte Supercomputer-Cluster vorgestellt. Der CS-Storm 500GT und der CS-Storm 500NX sind unterschiedlich aufgebaut, die Racks sind jedoch beide für Berechnungen ausgelegt, um eine künstliche Intelligenz zu entwickeln. Die verbaute Hardware und der mitgelieferte Software-Stack eignen sich für Algorithmen für Deep Learning und Machine Learning.

Stellenmarkt
  1. Elite Consulting Network Group über Elite Consulting Personal & Management Solutions GmbH, Essen
  2. ZfP Südwürttemberg, Bad Schussenried

Der CS-Storm 500NX basiert auf Blades mit zwei Broadwell-EP-basierten Xeon E5-2600 v4 und kann mit bis zu acht Tesla P100 ausgestattet werden. Dabei handelt es sich allerdings nicht um PCIe-Steckkarten, sondern um SXM2-Module mit Mezzanine-Anschlüssen. Es ist daher anzunehmen, dass eine Aufrüstung auf die neueren Tesla V100 möglich sein wird. Die acht Module kommunizieren durch Nvidias NV-Link, als Interconnects können Infiniband oder Omni Path verwendet werden. Storage-seitig sind bis zu zwölf 2,5-Zoll-SSDs vorgesehen, vier davon optional per NVMe. Die Hardware befindet sich in einem 4U-Blade.

Tesla P40 oder FPGAs für mehr Flexibiliät

Beim CS-Storm 500GT handelt es sich um eine weniger konventionelle Konfiguration. Cray verwendet zwei der neuen Skylake-SP-Xeons und kombiniert diese mit bis zu zehn Beschleunigern. Das können Tesla P100, wenn auch in der PCIe-Variante, oder Tesla P40 oder FPGAs von Nallatech sein. Letztere gibt es zum Beispiel als 510T mit zwei Arria 10 1150 GX und 2,8 Teraflops. Hinzu kommen bis zu 16 Drives in einem 3U- oder 4U-Blade.

Während sich der CS-Storm 500NX neben Training dank hoher FP64-Leistung auch für HPC eignet, zielt der CS-Storm 500GT eher auf Inferencing (FP16 oder INT8) ab. Cray spricht von bis zu 2,62 Teraops und bis zu 658 Teraflops (FP64) pro Rack. Die rechnerische Basis sind offensichtlich Tesla P100.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. 299,00€ (Bestpreis! zzgl. Versand)

x-beliebig 16. Mai 2017

mir geht der derzeitige "Künstliche Intelligenz" Hype (auch) auf die Nerven. Ich sehe...


Folgen Sie uns
       


Jedi Fallen Order - Fazit

Wer Fan von Star Wars ist und neben viel Macht auch eine gewisse Frusttoleranz in sich spürt, sollte Jedi Fallen Order eine Chance geben.

Jedi Fallen Order - Fazit Video aufrufen
Interview: Die Liebe für den Flight Simulator war immer da
Interview
"Die Liebe für den Flight Simulator war immer da"

Die prozedural erstellte Erde, der Quellcode vom letzten MS-Flugsimulator und eine Gemeinsamkeit mit Star Citizen: Golem.de hat mit Jörg Neumann über Technik und das Fliegen gesprochen. Neumann leitet bei Microsoft die Entwicklung des Flight Simulator.
Ein Interview von Peter Steinlechner

  1. Flug-Simulation Microsoft bereitet Alphatest des Flight Simulator vor
  2. Microsoft Neuer Flight Simulator soll Fokus auf Simulation legen

Staupilot: Der Zulassungsstau löst sich langsam auf
Staupilot
Der Zulassungsstau löst sich langsam auf

Nach jahrelangen Verhandlungen soll es demnächst internationale Zulassungskriterien für hochautomatisierte Autos geben. Bei höheren Automatisierungsgraden strebt die Bundesregierung aber einen nationalen Alleingang an.
Ein Bericht von Friedhelm Greis

  1. Autonomes Fahren Ermittler geben Testfahrerin Hauptschuld an Uber-Unfall
  2. Ermittlungsberichte Wie die Uber-Software den tödlichen Unfall begünstigte
  3. Firmentochter gegründet VW will in fünf Jahren autonom fahren

Core i9-10980XE im Test: Intel rettet sich über den Preis
Core i9-10980XE im Test
Intel rettet sich über den Preis

Nur wenige Stunden vor AMDs Threadripper v3 veröffentlicht Intel den i9-10980XE: Der hat 18 Kerne und beschleunigt INT8-Code für maschinelles Lernen. Vor allem aber kostet er die Hälfte seines Vorgängers, weil der günstigere Ryzen 3950X trotz weniger Cores praktisch genauso schnell ist.
Ein Test von Marc Sauter

  1. Prozessoren Intel meldet 14-nm-Lieferprobleme
  2. NNP-T und NNP-I Intel hat den T-1000 der künstlichen Intelligenz
  3. Kaby Lake G Intels AMD-Chip wird eingestellt

    •  /