16x Tesla V100: Nvidias DGX-2-System schafft 2 Petaflops

Das DGX-2 enthält doppelt so viele GPUs wie das DGX-1, die obendrein auf einen verdoppelten Speicher pro Chip zugreifen können. Auch bei den CPUs und deren RAM hat Nvidias Deep-Learning-System mehr von allem.

Artikel veröffentlicht am ,
Nvidias DGX-2
Nvidias DGX-2 (Bild: Marc Sauter/Golem.de)

Nvidia hat auf der Entwicklerkonferenz GTC 2018 das neue DGX-2 vorgestellt. Das Komplettsystem erreicht eine theoretische Rechenleistung von 2 Petaflops, wenn es um Matrix-Multiplikationen für etwa Deep Learning geht. Verglichen mit dem DGX-1 von vergangenem Jahr hat Nvidia die Geschwindigkeit damit mehr als verdoppelt, was auf zusätzliche und neue Hardware zurückzuführen ist, die in das DGX-2 integriert wurde.

Stellenmarkt
  1. Informatiker (m/w/d) als IT-Sachbearbeiter (m/w/d)
    Kommunale Unfallversicherung Bayern, München
  2. IT-Projektkoordinatoren und Prozessbegleiter (m/w/d)
    Schottener Soziale Dienste gemeinnützige GmbH, Schotten, remote
Detailsuche

Statt acht Tesla V100 sind gleich 16 der Rechenbeschleuniger als SMX2-Module verbaut. Die überarbeiteten Modelle haben zudem 32 GByte statt 16 GByte Speicher, da Nvidia mittlerweile auf HBM2 mit 8Hi-Stacks setzt, also acht statt vier Chips stapelt. Die restlichen Spezifikationen der Tesla V100 bleiben unangetastet. Um 16 davon zu verbinden, hat Nvidia einen 2-Milliarden-Transistoren-Switch entwickelt, der 18 Ports mit je 50 GByte/s aufweist (also 900 GByte/s) und per NV Link 2.0 die Rechenbeschleuniger (sechs Ports je Tesla V100) verknüpft. Im DGX-2 stecken insgesamt zwölf der NV-Switches, sie werden im 12FFN-Verfahren bei der TSMC gefertigt.

Angesteuert werden die Tesla V100 von zwei Xeon Platinum (Skylake-SP), wenngleich Nvidia nicht näher auf die Intel-CPUs eingegangen ist; wir tippen auf die Xeon Platinum 8180 mit 28 Kernen. Jeder der beiden Chips kann auf 768 GByte DDR4-Speicher zurückgreifen, hinzu kommen 30 Terabyte an SSD-Storage. Das DGX-2 soll eine Leistungsaufnahme von rund 10.000 Watt aufweisen und wird unter anderem von Microsoft für das Training von Spracherkennung und Übersetzungsalgorithmen für Bing oder Cortana verwendet.

Generell sei die verdoppelte Speicherkapazität der Tesla V100 zusammen mit 16 statt 8 der Rechenbeschleuniger sehr hilfreich: Laut Nvidia ist das DGX-2 rund zehnmal so schnell wie das DGX-1, wenn Facebooks Fairseq darauf trainiert wird.

Golem Karrierewelt
  1. Informationssicherheit in der Automobilindustrie nach VDA-ISA und TISAX® mit Zertifikat: Zwei-Tage-Workshop
    22./23.11.2022, Virtuell
  2. ITIL 4® Foundation: virtueller Zwei-Tage-Workshop
    29./30.08.2022, virtuell
Weitere IT-Trainings

Das DGX-2 soll im dritten Quartal 2018 erscheinen und 400.000 US-Dollar kosten. Das ältere DGX-1 wurde bisher für 150.000 US-Dollar verkauft.

Offenlegung: Golem.de hat auf Einladung von Nvidia an der GTC 2018 im kalifornischen San Jose teilgenommen. Die Reisekosten wurden zur Gänze von Nvidia übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Rotary Phone
Vom Wählscheiben-Bastelhandy zur eigenen Produktionsanlage

Justine Haupt hat ein Handy mit Wählscheibe entworfen - und gleich eine eigene Produktionsanlage zu Hause aufgebaut. Golem.de hat mit ihr gesprochen.
Ein Interview von Tobias Költzsch

Rotary Phone: Vom Wählscheiben-Bastelhandy zur eigenen Produktionsanlage
Artikel
  1. Internet: Indien verbannt den VLC Media Player
    Internet
    Indien verbannt den VLC Media Player

    Weder Downloadlink noch Webseite des VLC Media Players können von Indien aus aufgerufen werden. Der vermutete Grund: das Nachbarland China.

  2. John Deere: Ein Hacker präsentiert ein Jailbreak für Traktoren
    John Deere
    Ein Hacker präsentiert ein Jailbreak für Traktoren

    Nicht nur Telefonhersteller vernageln ihre Geräte. Der Hacker Sick Codes zeigt, wie Root-Zugriff auf die Systeme der Traktoren zu erlangen ist.

  3. Kryptowährungen: Tornado-Cash-Entwickler wegen Geldwäsche festgenommen
    Kryptowährungen
    Tornado-Cash-Entwickler wegen Geldwäsche festgenommen

    Der in den Niederlanden verhaftete Entwickler steht im Verdacht, für eine nordkoreanische Hackergruppe Kryptowährungen gewaschen zu haben.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Playstation Summer Sale: Games für PS5/PS4 bis 84% günstiger • Günstig wie nie: SSD 1TB/2TB (PS5), Curved Monitor UWQHD LG 38"/BenQ 32" • Razer-Aktion • MindStar (AMD Ryzen 7 5800X3D 455€, MSI RTX 3070 599€) • Lego Star Wars Neuheiten • Bester Gaming-PC für 2.000€ [Werbung]
    •  /