Abo
  • Services:
Anzeige
Tesla V100 mit GV100-Chip im SXM2-Formfaktor
Tesla V100 mit GV100-Chip im SXM2-Formfaktor (Bild: Marc Sauter/Golem.de)

Nvidias GV100-Chip: "Wir sind am Limit des technisch Möglichen"

Tesla V100 mit GV100-Chip im SXM2-Formfaktor
Tesla V100 mit GV100-Chip im SXM2-Formfaktor (Bild: Marc Sauter/Golem.de)

Die neue Volta-GPU ist so monströs, dass Nvidia beim Auftragsfertiger TSMC einen eigenen Herstellungsprozess nutzt und sogar die Grenzen der Maske sprengt. Dafür verantwortlich sind große Caches und die wohl riesigen Tensor-Cores.

Nvidia hat auf der GPU Technology Conference 2017 im kalifornischen San Jose weitere Details zum GV100-Chip mit Volta-Architektur verraten. Die GPU wird vorerst für drei Rechenbeschleuniger, den Tesla V100, mit Fokus auf Deep Learning eingesetzt: Einem SXM2-Modul mit Mezzanine-Anschlüssen und 300 Watt TDP, einer klassischen PCIe-Steckkarte mit 250 Watt und einem 150-Watt-Ableger davon. Um die reduzierte Leistungsaufnahme zu erreichen, drosselt Nvidia die Taktraten, die Anzahl der Shader-Einheiten bleibt gleich.

Anzeige
  • Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)
  • Die GPU misst 815 mm², ein HBM2-Stack rund 92 mm² (Foto: Marc Sauter/Golem.de)
  • Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)
  • Volta unterscheidet sich stark von Pascal (Foto: Marc Sauter/Golem.de)
  • Der L1-Cache ist größer und schneller (Foto: Marc Sauter/Golem.de)
  • Volta beherrscht eine verbesserte Warp-Ausführung (Foto: Marc Sauter/Golem.de)
  • Die Tensor-Cores beschleunigen FP16 (Foto: Marc Sauter/Golem.de)
  • NV-Link 2.0 verbindet mehrere Tesla V100 (Foto: Marc Sauter/Golem.de)
Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)

Mit einer Fläche (Die-Size) von 815 mm² ist der GV100 die größte je gebaute GPU. Um einen solchen Chip zu realisieren, kommt das 12FFN-Verfahren von TSMC zum Einsatz. Das steht für 12 nm FinFET Nvidia, da eine modifizierte Variante für eine höhere Transistordichte und bessere Effizienz entwickelt wurde. Der Interposer, auf welchem der GV100 und die vier HBM2-Speicherstapel sitzen, sprengt die Dimensionen der Maske (Reticle), weshalb für ihn zwei Belichtungsdurchgänge benötigt werden.

Auf die obligatorische Frage nach der Chipausbeute (Yield) antwortete Nvidia, dass die Lieferung Abertausender von Tesla V100 belege, dass die GV100-GPU in Serie produzierbar sein. Den scherzhaften Kommentar, wie viele Wafer pro funktionierendem Chip notwendig seien, sorgte dementsprechend für ein breites Grinsen bei Nvidias Jonah Alben. Der Senior VP of GPU Engineering erläuterte anschließend, dass die neuen Tensor-Cores, die unter anderem für die drastisch gestiegene FP16-Rechenleistung verantwortlich sind, viel Platz benötigen. Relative Angaben wollte Alben aber lieber keine machen.

Zu den Verbesserungen des GV100-Chips gehört der L1-Cache. Der weist 128 statt 24 KByte auf und erreicht die vierfache Bandbreite. Weil er mit dem Shared Memory (der auf bis zu 96 der 128 KByte konfigurierbar ist) vereint wurde, sinkt die Latenz und die Programmierbarkeit wird einfacher. Volta unterscheidet sich bei den verdoppelten Schedulern und der Ausführung von Threads massiv von Pascal, die ISA und das SIMT-Modell sind ein anderes.

  • Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)
  • Die GPU misst 815 mm², ein HBM2-Stack rund 92 mm² (Foto: Marc Sauter/Golem.de)
  • Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)
  • Volta unterscheidet sich stark von Pascal (Foto: Marc Sauter/Golem.de)
  • Der L1-Cache ist größer und schneller (Foto: Marc Sauter/Golem.de)
  • Volta beherrscht eine verbesserte Warp-Ausführung (Foto: Marc Sauter/Golem.de)
  • Die Tensor-Cores beschleunigen FP16 (Foto: Marc Sauter/Golem.de)
  • NV-Link 2.0 verbindet mehrere Tesla V100 (Foto: Marc Sauter/Golem.de)
Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)

Obgleich Nvidia den GV100 aufgrund seiner FP64- und FP16-Leistung in erster Linie im Profisegment positioniert, eignet sich der Chip auch als Basis für eine Quadro-Workstation- oder Geforce-Gaming-Grafikkarte.


eye home zur Startseite
B.I.G 15. Mai 2017

nMP? New Mac Pro? Wie um alles in der Welt hast du AMD dazu bekommen die W9000 für den...

Themenstart

ronlol 14. Mai 2017

Keine Sorge, ich war von Anfang an mit einer Diamond Monster 3D dabei und später auch...

Themenstart

schily 12. Mai 2017

Also der IBM Z13 Prozessor hat 678,8qmm und 3,99 Milliarden Transistoren auf 17...

Themenstart

ckerazor 12. Mai 2017

Selbst wenn es einmal ein Material geben sollte, welches die notwendigen supraleitenden...

Themenstart

Ach 12. Mai 2017

Tja, das ist dann bei neuronalen Netzwerken eben die Frage. Die Muster nach denen der...

Themenstart

Kommentieren



Anzeige

Stellenmarkt
  1. Ratbacher GmbH, Raum Köln
  2. ARRK ENGINEERING, Ingolstadt
  3. T-Systems International GmbH, Stuttgart, Leinfelden-Echterdingen
  4. I.T.E.N.O.S. International Telecom Network Operation Services GmbH, Bonn


Anzeige
Hardware-Angebote
  1. (Core i5-7600K + Asus GTX 1060 Dual OC)
  2. und bis zu 60€ Steam-Guthaben erhalten
  3. 1.029,00€ + 5,99€ Versand

Folgen Sie uns
       


  1. Autonomes Fahren

    Neues Verfahren beschleunigt Tests für autonome Autos

  2. Künstliche Intelligenz

    Alpha Go geht in Rente

  3. Security

    Telekom-Chef vergleicht Cyberangriffe mit Landminen

  4. Anga

    Kabelnetzbetreiber wollen schnelle Analogabschaltung

  5. Asus

    Das Zenbook Flip S ist 10,9 mm flach

  6. Hate Speech

    Facebook wehrt sich gegen Gesetz gegen Hass im Netz

  7. Blackberry

    Qualcomm muss fast 1 Milliarde US-Dollar zurückzahlen

  8. Surface Ergonomische Tastatur im Test

    Eins werden mit Microsofts Tastatur

  9. Russischer Milliardär

    Nonstop-Weltumrundung mit Solarflugzeug geplant

  10. BMW Motorrad Concept Link

    Auch BMW plant Elektromotorrad



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Asus B9440 im Test: Leichtes Geschäftsnotebook liefert zu wenig Business
Asus B9440 im Test
Leichtes Geschäftsnotebook liefert zu wenig Business
  1. ROG-Event in Berlin Asus zeigt gekrümmtes 165-Hz-Quantum-Dot-Display und mehr

Elektromobilität: Wie kommt der Strom in die Tiefgarage?
Elektromobilität
Wie kommt der Strom in die Tiefgarage?
  1. Elektroauto Tesla gewährt rückwirkend Supercharger-Gratisnutzung
  2. Elektroautos Merkel hofft auf Bau von Batteriezellen in Deutschland
  3. Strategische Entscheidung Volvo setzt voll auf Elektro und trennt sich vom Diesel

In eigener Sache: Die Quanten kommen!
In eigener Sache
Die Quanten kommen!
  1. id Software "Global Illumination ist derzeit die größte Herausforderung"
  2. In eigener Sache Golem.de führt kostenpflichtige Links ein
  3. In eigener Sache Golem.de sucht Marketing Manager (w/m)

  1. Re: Bluetooth

    chucu | 11:40

  2. Gibt es noch Menschen die Analog schauen

    Mastercontrol | 11:40

  3. Re: offenkundig strafbare Inhalte

    lustiger Lurch | 11:40

  4. Re: Akkuproblem noch viel schlimmer als bei PKW!

    kylecorver | 11:39

  5. Re: "Hass im Netz" klingt nach Zensur für mich

    Niaxa | 11:35


  1. 11:25

  2. 10:51

  3. 10:50

  4. 10:17

  5. 10:12

  6. 09:53

  7. 09:12

  8. 09:10


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel