Abo
  • Services:

16x Tesla V100: Nvidias DGX-2-System schafft 2 Petaflops

Das DGX-2 enthält doppelt so viele GPUs wie das DGX-1, die obendrein auf einen verdoppelten Speicher pro Chip zugreifen können. Auch bei den CPUs und deren RAM hat Nvidias Deep-Learning-System mehr von allem.

Artikel veröffentlicht am ,
Nvidias DGX-2
Nvidias DGX-2 (Bild: Marc Sauter/Golem.de)

Nvidia hat auf der Entwicklerkonferenz GTC 2018 das neue DGX-2 vorgestellt. Das Komplettsystem erreicht eine theoretische Rechenleistung von 2 Petaflops, wenn es um Matrix-Multiplikationen für etwa Deep Learning geht. Verglichen mit dem DGX-1 von vergangenem Jahr hat Nvidia die Geschwindigkeit damit mehr als verdoppelt, was auf zusätzliche und neue Hardware zurückzuführen ist, die in das DGX-2 integriert wurde.

Stellenmarkt
  1. ALBA Nordbaden GmbH, Karlsruhe
  2. Freie und Hansestadt Hamburg, Hamburg

Statt acht Tesla V100 sind gleich 16 der Rechenbeschleuniger als SMX2-Module verbaut. Die überarbeiteten Modelle haben zudem 32 GByte statt 16 GByte Speicher, da Nvidia mittlerweile auf HBM2 mit 8Hi-Stacks setzt, also acht statt vier Chips stapelt. Die restlichen Spezifikationen der Tesla V100 bleiben unangetastet. Um 16 davon zu verbinden, hat Nvidia einen 2-Milliarden-Transistoren-Switch entwickelt, der 18 Ports mit je 50 GByte/s aufweist (also 900 GByte/s) und per NV Link 2.0 die Rechenbeschleuniger (sechs Ports je Tesla V100) verknüpft. Im DGX-2 stecken insgesamt zwölf der NV-Switches, sie werden im 12FFN-Verfahren bei der TSMC gefertigt.

Angesteuert werden die Tesla V100 von zwei Xeon Platinum (Skylake-SP), wenngleich Nvidia nicht näher auf die Intel-CPUs eingegangen ist; wir tippen auf die Xeon Platinum 8180 mit 28 Kernen. Jeder der beiden Chips kann auf 768 GByte DDR4-Speicher zurückgreifen, hinzu kommen 30 Terabyte an SSD-Storage. Das DGX-2 soll eine Leistungsaufnahme von rund 10.000 Watt aufweisen und wird unter anderem von Microsoft für das Training von Spracherkennung und Übersetzungsalgorithmen für Bing oder Cortana verwendet.

Generell sei die verdoppelte Speicherkapazität der Tesla V100 zusammen mit 16 statt 8 der Rechenbeschleuniger sehr hilfreich: Laut Nvidia ist das DGX-2 rund zehnmal so schnell wie das DGX-1, wenn Facebooks Fairseq darauf trainiert wird.

Das DGX-2 soll im dritten Quartal 2018 erscheinen und 400.000 US-Dollar kosten. Das ältere DGX-1 wurde bisher für 150.000 US-Dollar verkauft.

Offenlegung: Golem.de hat auf Einladung von Nvidia an der GTC 2018 im kalifornischen San Jose teilgenommen. Die Reisekosten wurden zur Gänze von Nvidia übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.



Anzeige
Top-Angebote
  1. ab 519€ bei Alternate lieferbar
  2. (u. a. Pacific Rim Uprising, Game Night, Greatest Showman, Lady Bird, Ghostland, Weltengänger)
  3. WLAN-Repeater 21,60€, 8-Port-Switch 26,60€, Nano WLAN USB-Adapter 5,75€)
  4. (heute u. a. Dockin Bluetooth-Lautsprecher)

Cerdo 28. Mär 2018

Naja ich rede schon von Reflexionen und Schatten in 4K-Videospielen. Über triviales Zeug...


Folgen Sie uns
       


BMW stellt seinen Formel-E-Rennwagen vor - Bericht

BMW setzt auf elektrischen Motorsport: Die Münchener treten als zweiter deutscher Autohersteller in der Rennserie Formel E an. BMW hat in München das Fahrzeug für die Saison 2018/19 vorgestellt.

BMW stellt seinen Formel-E-Rennwagen vor - Bericht Video aufrufen
Augmented Reality: Das AR-Fabrikgelände aus dem Smartphone
Augmented Reality
Das AR-Fabrikgelände aus dem Smartphone

Derzeit ist viel von einer Augmented Reality Cloud die Rede. Golem.de hat mit dem Berliner Startup Visualix über den Stand der Technik und künftige Projekte für Unternehmenskunden gesprochen - und darüber, was die Neuerungen für Pokémon Go bedeuten könnten.
Ein Interview von Achim Fehrenbach

  1. Jarvish Motorradhelm bringt Alexa in den Kopf
  2. Patentantrag Apple plant Augmented-Reality in der Windschutzscheibe
  3. Magic Leap Lumin OS Erste Bilder des Betriebssystems für Augmented Reality

Apple Watch im Test: Auch ohne EKG die beste Smartwatch
Apple Watch im Test
Auch ohne EKG die beste Smartwatch

Apples vierte Watch verändert das Display-Design leicht - zum Wohle des Nutzers. Die Uhr bietet immer noch mit die beste Smartwatch-Erfahrung, auch wenn eine der neuen Funktionen in Deutschland noch nicht funktioniert.
Ein Test von Tobias Költzsch

  1. Skydio R1 Apple Watch zur Drohnensteuerung verwendet
  2. Smartwatch Apple Watch Series 4 mit EKG und Sturzerkennung
  3. Smartwatch Apple Watch Series 4 nur mit sechs Modellen

Campusnetze: Das teure Versäumnis der Telekom
Campusnetze
Das teure Versäumnis der Telekom

Die Deutsche Telekom muss anderen Konzernen bei 5G-Campusnetzen entgegenkommen. Jahrzehntelang von Funklöchern auf dem Lande geplagt, wollen Siemens und die Automobilindustrie nun selbst Mobilfunknetze aufspannen. Auch der öffentliche Rundfunk will selbst 5G machen.
Eine Analyse von Achim Sawall

  1. Stadtnetzbetreiber 5G-Netz kann auch aus der Box kommen
  2. Achim Berg "In Sachen Gigabit ist Deutschland ein großer weißer Fleck"
  3. Telefónica Bündelung von Bandbreiten aus 4G und 5G ist doch möglich

    •  /