• IT-Karriere:
  • Services:

DGX-1: Nvidias Supercomputerchen mit 8x Tesla P100

Zwei Xeon-Prozessoren, acht Tesla-P100-Beschleuniger mit Pascal-Technik und 170 Teraflops bei halber Genauigkeit: Nvidias neuer DGX-1 ist ein Deep-Learning-Supercomputer im kompakten Rack-Format.

Artikel veröffentlicht am ,
DGX-1
DGX-1 (Bild: Nvidia)

Nvidia hat auf der GPU Technology Conference 2016 in San Jose, Kalifornien, den DGX-1 vorgestellt. CEO Jen-Hsun Huang beschreibt diesen als Supercomputer in a Box für Deep Learning, denn genau genommen handelt es sich um ein Rack in einem abgeschlossenen Gehäuse. Im DGX-1 stecken acht der neuen Tesla-P100-Beschleunigerkarten mit Pascal-Technik, weshalb die theoretische Rechenleistung für den kompakten Formfaktor sehr hoch ausfällt.

  • Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)
  • Im System stecken acht Tesla P100. (Foto: Marc Sauter/Golem.de)
  • Der Mini-Supercomputer kostet 129.000 US-Dollar. (Foto: Marc Sauter/Golem.de)
  • DGX-1 verglichen mit zwei Haswell-EP (Foto: Marc Sauter/Golem.de)
  • DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)
Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)
Stellenmarkt
  1. Kassenzahnärztliche Vereinigung Westfalen-Lippe, Münster
  2. medneo GmbH, Berlin

Der DGX-1 basiert auf einem Dual-Sockel-Board mit zwei Xeon E5-2698 v3. Die beiden 16-Kern-Chips nutzen die Haswell-Architektur und takten mit 2,3 bis 3,6 GHz. Unterstützt werden die Prozessoren von 512 GByte DDR4-2133-Arbeitsspeicher und vier PCIe-SSDs mit jeweils 1,92 TByte im Raid-0. Die eigentliche Rechenleistung liefern die acht Tesla P100: Eine Karte erreicht 21,2 Teraflops bei für Deep Learning völlig ausreichender halber Genauigkeit (FP16, Half Precision). Aufaddiert sind das satte rund 170 Teraflops.

Um die Kommunikation zwischen den einzelnen GPUs zu beschleunigen, nutzt Nvidia den proprietären NV-Link mit 160 GByte pro Sekunde anstatt Daten über den mit 16 GByte pro Sekunde vergleichsweise langsamen PCIe-3.0-x16-Bus zu schicken. Die Leistungsaufnahme des DGX-1 beläuft sich auf 3.200 Watt, zwei 10-GBit-Ethernet-Anschlüsse verbinden das System mit der Außenwelt, hinzu kommt ein 100-GBit-Quad-Infiniband.

  • Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)
  • Im System stecken acht Tesla P100. (Foto: Marc Sauter/Golem.de)
  • Der Mini-Supercomputer kostet 129.000 US-Dollar. (Foto: Marc Sauter/Golem.de)
  • DGX-1 verglichen mit zwei Haswell-EP (Foto: Marc Sauter/Golem.de)
  • DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)
DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)

Nvidia vergleicht die Geschwindigkeit des Deep-Learning-Rechners mit zwei Haswell-16-Kern-Xeons und mit der Digits Devbox: Die beiden Prozessoren erreichen wenig überraschend nur 3 Teraflops, die Devbox aufgrund von vier Titan X immerhin knapp 25 Teraflops. Dank architektonischer Verbesserungen sind die acht Tesla P100 aber um den Faktor 12 schneller, wenn es darum geht, einen Bildererkennungsalgorithmus zu berechnen.

Ab Juni 2016 soll der DGX-1 für 129.000 US-Dollar verfügbar sein.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 4,65€
  2. (-75%) 4,99€
  3. 25,99€
  4. 4,25€

Poison Nuke 06. Apr 2016

es steht direkt auf der zweiten Folie drauf, also hier bei Golem das zweite Bild. Und...


Folgen Sie uns
       


Looking Glass Holo-Display angesehen (CES 2020)

Der Looking Glass 8K ist ein Monitor, der mittels Lichtfeldtechnologie 3D-Inhalte als Hologramm anzeigen kann. Golem.de hat sich das Display auf der CES 2020 genauer angeschaut.

Looking Glass Holo-Display angesehen (CES 2020) Video aufrufen
Energiewende: Norddeutschland wird H
Energiewende
Norddeutschland wird H

Japan macht es vor, die norddeutschen Bundesländer ziehen nach: Im November haben sie den Aufbau einer Wasserstoffwirtschaft beschlossen. Die Voraussetzungen dafür sind gegeben. Aber das Ende der Förderung von Windkraft kann das Projekt gefährden.
Eine Analyse von Werner Pluta

  1. Energiewende Brandenburg bekommt ein Wasserstoff-Speicherkraftwerk
  2. Energiewende Dänemark plant künstliche Insel für Wasserstofferzeugung
  3. Energiewende Nordländer bauen gemeinsame Wasserstoffwirtschaft auf

Fitnesstracker im Test: Aldi sportlich abgeschlagen hinter Honor und Mi Band 4
Fitnesstracker im Test
Aldi sportlich abgeschlagen hinter Honor und Mi Band 4

Alle kosten um die 30 Euro, haben ähnliche Funktionen - trotzdem gibt es bei aktuellen Fitnesstrackern von Aldi, Honor und Xiaomi spürbare Unterschiede. Als größte Stärke des Geräts von Aldi empfanden wir kurioserweise eine technische Schwäche.
Von Peter Steinlechner

  1. Wearable Acer und Vatikan präsentieren smarten Rosenkranz
  2. Apple Watch Series 5 im Test Endlich richtungsweisend
  3. Suunto 5 Sportuhr mit schlauem Akku vorgestellt

Open Power CPU: Open-Source-ISA als letzte Chance
Open Power CPU
Open-Source-ISA als letzte Chance

Die CPU-Architektur Power fristet derzeit ein Nischendasein, wird aber Open Source. Das könnte auch mit Blick auf RISC-V ein notwendiger Befreiungsschlag werden. Dafür muss aber einiges zusammenkommen und sehr viel passen.
Eine Analyse von Sebastian Grüner

  1. Open Source Monitoring-Lösung Sentry wechselt auf proprietäre Lizenz
  2. VPN Wireguard fliegt wegen Spendenaufruf aus Play Store
  3. Picolibc Neue C-Bibliothek für Embedded-Systeme vorgestellt

    •  /