Nvidias GV100-Chip: "Wir sind am Limit des technisch Möglichen"

Die neue Volta-GPU ist so monströs, dass Nvidia beim Auftragsfertiger TSMC einen eigenen Herstellungsprozess nutzt und sogar die Grenzen der Maske sprengt. Dafür verantwortlich sind große Caches und die wohl riesigen Tensor-Cores.

Artikel veröffentlicht am ,
Tesla V100 mit GV100-Chip im SXM2-Formfaktor
Tesla V100 mit GV100-Chip im SXM2-Formfaktor (Bild: Marc Sauter/Golem.de)

Nvidia hat auf der GPU Technology Conference 2017 im kalifornischen San Jose weitere Details zum GV100-Chip mit Volta-Architektur verraten. Die GPU wird vorerst für drei Rechenbeschleuniger, den Tesla V100, mit Fokus auf Deep Learning eingesetzt: Einem SXM2-Modul mit Mezzanine-Anschlüssen und 300 Watt TDP, einer klassischen PCIe-Steckkarte mit 250 Watt und einem 150-Watt-Ableger davon. Um die reduzierte Leistungsaufnahme zu erreichen, drosselt Nvidia die Taktraten, die Anzahl der Shader-Einheiten bleibt gleich.

  • Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)
  • Die GPU misst 815 mm², ein HBM2-Stack rund 92 mm² (Foto: Marc Sauter/Golem.de)
  • Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)
  • Volta unterscheidet sich stark von Pascal (Foto: Marc Sauter/Golem.de)
  • Der L1-Cache ist größer und schneller (Foto: Marc Sauter/Golem.de)
  • Volta beherrscht eine verbesserte Warp-Ausführung (Foto: Marc Sauter/Golem.de)
  • Die Tensor-Cores beschleunigen FP16 (Foto: Marc Sauter/Golem.de)
  • NV-Link 2.0 verbindet mehrere Tesla V100 (Foto: Marc Sauter/Golem.de)
Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)
Stellenmarkt
  1. CAD/CAM Programmierer (w/m/d)
    AIXTRON SE, Herzogenrath
  2. Scientific IT Gruppenleitung (m/w/d)
    Fraunhofer-Institut für Kurzzeitdynamik, Ernst-Mach-Institut EMI, Freiburg
Detailsuche

Mit einer Fläche (Die-Size) von 815 mm² ist der GV100 die größte je gebaute GPU. Um einen solchen Chip zu realisieren, kommt das 12FFN-Verfahren von TSMC zum Einsatz. Das steht für 12 nm FinFET Nvidia, da eine modifizierte 16-nm-Variante für eine höhere Transistordichte und bessere Effizienz entwickelt wurde. Der Interposer, auf welchem der GV100 und die vier HBM2-Speicherstapel sitzen, sprengt die Dimensionen der Maske (Reticle), weshalb für ihn zwei Belichtungsdurchgänge benötigt werden.

Auf die obligatorische Frage nach der Chipausbeute (Yield) antwortete Nvidia, dass die Lieferung Abertausender von Tesla V100 belege, dass die GV100-GPU in Serie produzierbar sein. Den scherzhaften Kommentar, wie viele Wafer pro funktionierendem Chip notwendig seien, sorgte dementsprechend für ein breites Grinsen bei Nvidias Jonah Alben. Der Senior VP of GPU Engineering erläuterte anschließend, dass die neuen Tensor-Cores, die unter anderem für die drastisch gestiegene FP16-Rechenleistung verantwortlich sind, viel Platz benötigen. Relative Angaben wollte Alben aber lieber keine machen.

Zu den Verbesserungen des GV100-Chips gehört der L1-Cache. Der weist 128 statt 24 KByte auf und erreicht die vierfache Bandbreite. Weil er mit dem Shared Memory (der auf bis zu 96 der 128 KByte konfigurierbar ist) vereint wurde, sinkt die Latenz und die Programmierbarkeit wird einfacher. Volta unterscheidet sich bei den verdoppelten Schedulern und der Ausführung von Threads massiv von Pascal, die ISA und das SIMT-Modell sind ein anderes.

  • Tesla V100 mit GV100-Chip (Foto: Marc Sauter/Golem.de)
  • Die GPU misst 815 mm², ein HBM2-Stack rund 92 mm² (Foto: Marc Sauter/Golem.de)
  • Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)
  • Volta unterscheidet sich stark von Pascal (Foto: Marc Sauter/Golem.de)
  • Der L1-Cache ist größer und schneller (Foto: Marc Sauter/Golem.de)
  • Volta beherrscht eine verbesserte Warp-Ausführung (Foto: Marc Sauter/Golem.de)
  • Die Tensor-Cores beschleunigen FP16 (Foto: Marc Sauter/Golem.de)
  • NV-Link 2.0 verbindet mehrere Tesla V100 (Foto: Marc Sauter/Golem.de)
Ein Shader-Multiprocessor enthält FP- und INT-Einheiten sowie Tensor-Cores (Foto: Marc Sauter/Golem.de)
Golem Karrierewelt
  1. DP-203 Data Engineering on Microsoft Azure: virtueller Vier-Tage-Workshop
    24.-27.10.2022, virtuell
  2. Container Management und Orchestrierung: virtueller Drei-Tage-Workshop
    23.-25.11.2022, Virtuell
Weitere IT-Trainings

Obgleich Nvidia den GV100 aufgrund seiner FP64- und FP16-Leistung in erster Linie im Profisegment positioniert, eignet sich der Chip auch als Basis für eine Quadro-Workstation- oder Geforce-Gaming-Grafikkarte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anonymer Nutzer 17. Jul 2017

Mein Gott, haben wir inzwischen Luxus-Probleme! :-D

thepiman 07. Jul 2017

"Oger haben Schichten..."

B.I.G 15. Mai 2017

nMP? New Mac Pro? Wie um alles in der Welt hast du AMD dazu bekommen die W9000 für den...

Anonymer Nutzer 12. Mai 2017

Selbst wenn es einmal ein Material geben sollte, welches die notwendigen supraleitenden...



Aktuell auf der Startseite von Golem.de
Neue Grafikkarten
Erste Preise für Nvidias Geforce RTX 4090 aufgetaucht

Der US-Händler Newegg gibt einen Blick auf die Preise der Nvidia-Ada-Grafikkarten. Sie werden teurer als die Geforce RTX 3090 zuvor.

Neue Grafikkarten: Erste Preise für Nvidias Geforce RTX 4090 aufgetaucht
Artikel
  1. Smart Home Eco Systems: Was unterscheidet Alexa von Homekit von Google Home?
    Smart Home Eco Systems
    Was unterscheidet Alexa von Homekit von Google Home?

    Alexa, Homekit, Google Home - ist das nicht eigentlich alles das Gleiche? Nein, es gibt erhebliche Unterschiede bei Sprachsteuerung, Integration und Datenschutz. Ein Vergleich.
    Eine Analyse von Karl-Heinz Müller

  2. Hideo Kojima: Es sollte ein Death-Stranding-Spiel für Google Stadia geben
    Hideo Kojima
    Es sollte ein Death-Stranding-Spiel für Google Stadia geben

    Hideo Kojima arbeitete am Exklusivtitel für Stadia. Das wurde vorzeitig eingestellt, auch weil Google nicht an Einzelspieler-Games glaubte.

  3. Superbase V: Zendures Solarstation mit 6.400 Wh kommt mit hohem Rabatt
    Superbase V
    Zendures Solarstation mit 6.400 Wh kommt mit hohem Rabatt

    Vor dem Verkaufsstart über die eigene Webseite verkauft Zendure seine Superbase V über Kickstarter - mit teilweise fast 50 Prozent Rabatt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Razer DeathAdder V3 Pro 106,39€ • Alternate (u. a. Kingston FURY Beast RGB 32 GB DDR5-6000 226,89€, be quiet! Silent Base 802 Window 156,89€) • MindFactory (u. a. Kingston A400 240/480 GB 17,50€/32€) • SanDisk microSDXC 400 GB 29,99€ • PCGH-Ratgeber-PC 3000 Radeon Edition 2.500€ [Werbung]
    •  /