Neue GPU: Nvidias Pascal mit 3D-RAM und schneller NV-Link-Anbindung

Erst im Jahr 2016 will Nvidia den Nachfolger von Maxwell auf den Markt bringen. Die neue GPU-Architektur Pascal arbeitet mit Stacked-Memory und einem integrierten PCIe-Switch, der Multi-GPU-Systeme deutlich beschleunigen soll.

Artikel veröffentlicht am , /
Nvidias Chef Jen-Hsun Huang auf der Hausmesse GPU Technology Conference.
Nvidias Chef Jen-Hsun Huang auf der Hausmesse GPU Technology Conference. (Bild: Andreas Sebayang/Golem.de)

Nvidias Chef Jen-Hsun Huang will einen der Flaschenhälse auf Systemen mit mehreren GPUs beseitigen. Dies gab der Mitbegründer des Unternehmens zum Start der Konferenz GTC 2014 in einer Keynote-Ansprache bekannt. Mit NV-Link verspricht Huang, eine Datenverbindung zwischen GPU und CPU und auch GPU und GPU um den Faktor 5 bis 12 zu beschleunigen. Die Technik soll für Nvidias nächste GPU-Generation genutzt werden und basiert auf PCI-Express. Dazu wird ein PCIe-Switch direkt in die Grafikprozessoren integriert.

  • Jen-Hsun Huang zeigt das Testmodul mit Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Nvidias GTC wächst ... (Foto: Andreas Sebayang/Golem.de)
  • ... und zahlreiche Firmen interessieren sich für GPGPU-Computing. (Foto: Andreas Sebayang/Golem.de)
  • Mit der nächsten Chip-Generation will Nvidia mehrere Probleme lösen. (Foto: Andreas Sebayang/Golem.de)
  • NVlink soll nicht nur für eine sehr schnelle CPU-Anbindung sorgen, ... (Foto: Andreas Sebayang/Golem.de)
  • ... sondern auch die Verbindung zwischen GPUs weiter beschleunigen. (Foto: Andreas Sebayang/Golem.de)
  • Stacked Memory wird eine Teiltechnik in Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Das Pascal-Testmodul. (Foto: Andreas Sebayang/Golem.de)
  • Bis 2016 soll Pascal fertig werden ... (Foto: Andreas Sebayang/Golem.de)
  • ... und die Erkennung von Gegenständen vereinfachen. (Foto: Andreas Sebayang/Golem.de)
  • Auch künstliche Intelligenz soll verbessert werden. (Foto: Andreas Sebayang/Golem.de)
  • Einen Schwerpunkt setzt Nvidia auf die Simulation ... (Foto: Andreas Sebayang/Golem.de)
  • ... von Gehirnen. (Foto: Andreas Sebayang/Golem.de)
  • Testsetup zur Erkennung von Daten. (Screenshot: Golem.de)
  • Links oben die Chipstapel für 3D-Memory. (Screenshot: Golem.de)
  • Nvidias neue Roadmap: Erst 2016 mit Pascal eine neue Architektur. (Screenshot: Golem.de)
Jen-Hsun Huang zeigt das Testmodul mit Pascal. (Foto: Andreas Sebayang/Golem.de)

Auch beim Chipdesign will Nvidia die Bandbreite drastisch erhöhen und arbeitet am 3D-Speicher. Dazu nutzt Nvidia 3D-Packaging und will nicht nur die Kapazität der Speicher um den Faktor 2,5 bis 4 steigern. Da der 3D-Speicher direkt auf der GPU sitzt, sollen künftige Grafikmodule nur noch ein Drittel der Größe einer bisherigen Grafikkarte erreichen. Das ist aber wohl nur für die passiv gekühlten Tesla-Beschleuniger in Server-Racks machbar, die Kühler für schnelle PC-Grafikkarten können bei 200 bis 300 Watt kaum kleiner werden. Angaben zur TDP von Pascal machte Nvidia aber noch nicht.

  • Jen-Hsun Huang zeigt das Testmodul mit Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Nvidias GTC wächst ... (Foto: Andreas Sebayang/Golem.de)
  • ... und zahlreiche Firmen interessieren sich für GPGPU-Computing. (Foto: Andreas Sebayang/Golem.de)
  • Mit der nächsten Chip-Generation will Nvidia mehrere Probleme lösen. (Foto: Andreas Sebayang/Golem.de)
  • NVlink soll nicht nur für eine sehr schnelle CPU-Anbindung sorgen, ... (Foto: Andreas Sebayang/Golem.de)
  • ... sondern auch die Verbindung zwischen GPUs weiter beschleunigen. (Foto: Andreas Sebayang/Golem.de)
  • Stacked Memory wird eine Teiltechnik in Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Das Pascal-Testmodul. (Foto: Andreas Sebayang/Golem.de)
  • Bis 2016 soll Pascal fertig werden ... (Foto: Andreas Sebayang/Golem.de)
  • ... und die Erkennung von Gegenständen vereinfachen. (Foto: Andreas Sebayang/Golem.de)
  • Auch künstliche Intelligenz soll verbessert werden. (Foto: Andreas Sebayang/Golem.de)
  • Einen Schwerpunkt setzt Nvidia auf die Simulation ... (Foto: Andreas Sebayang/Golem.de)
  • ... von Gehirnen. (Foto: Andreas Sebayang/Golem.de)
  • Testsetup zur Erkennung von Daten. (Screenshot: Golem.de)
  • Links oben die Chipstapel für 3D-Memory. (Screenshot: Golem.de)
  • Nvidias neue Roadmap: Erst 2016 mit Pascal eine neue Architektur. (Screenshot: Golem.de)
Links oben die Chipstapel für 3D-Memory. (Screenshot: Golem.de)

Das "3D Memory" wird noch bei der Chipherstellung selbst auf den Wafern angebracht. Das ist nötig, weil die Verbindung zwischen GPU und Speicherbausteinen mit "Through-Silicon Vias" (TSV) hergestellt wird. Dabei sind die Metallverbindungen, auch Vias genannt, welche sonst die verschiedenen Schichten (Layer) eines Chips verbinden, aus dem Die herausgeführt. Sie binden das RAM der GPU nun direkt an. Durch diese nur millimeterkurzen Verbindungen können weitaus höhere Takte erreicht werden. Den Hersteller des Speichers verriet Huang nicht, Samsung stellt jedoch schon seit 2011 TSV-Chips her.

Die beiden Techniken Nvlink und 3D-Speicher will Nvidia in dem Chip der nächsten Generation einsetzen: Pascal. Nvidias Pascal wird Huang zufolge vor allem große Datenmengen bewältigen können. Neuronale Netzwerke und Erkennung von Daten in Bildern über eine künstliche Intelligenz soll mit Pascal vereinfacht werden. Er will etwa einzelne Gegenstände und Katzen in Bildern erkennen und nicht mehr nur menschliche Gesichter.

  • Jen-Hsun Huang zeigt das Testmodul mit Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Nvidias GTC wächst ... (Foto: Andreas Sebayang/Golem.de)
  • ... und zahlreiche Firmen interessieren sich für GPGPU-Computing. (Foto: Andreas Sebayang/Golem.de)
  • Mit der nächsten Chip-Generation will Nvidia mehrere Probleme lösen. (Foto: Andreas Sebayang/Golem.de)
  • NVlink soll nicht nur für eine sehr schnelle CPU-Anbindung sorgen, ... (Foto: Andreas Sebayang/Golem.de)
  • ... sondern auch die Verbindung zwischen GPUs weiter beschleunigen. (Foto: Andreas Sebayang/Golem.de)
  • Stacked Memory wird eine Teiltechnik in Pascal. (Foto: Andreas Sebayang/Golem.de)
  • Das Pascal-Testmodul. (Foto: Andreas Sebayang/Golem.de)
  • Bis 2016 soll Pascal fertig werden ... (Foto: Andreas Sebayang/Golem.de)
  • ... und die Erkennung von Gegenständen vereinfachen. (Foto: Andreas Sebayang/Golem.de)
  • Auch künstliche Intelligenz soll verbessert werden. (Foto: Andreas Sebayang/Golem.de)
  • Einen Schwerpunkt setzt Nvidia auf die Simulation ... (Foto: Andreas Sebayang/Golem.de)
  • ... von Gehirnen. (Foto: Andreas Sebayang/Golem.de)
  • Testsetup zur Erkennung von Daten. (Screenshot: Golem.de)
  • Links oben die Chipstapel für 3D-Memory. (Screenshot: Golem.de)
  • Nvidias neue Roadmap: Erst 2016 mit Pascal eine neue Architektur. (Screenshot: Golem.de)
Nvidias neue Roadmap: Erst 2016 mit Pascal eine neue Architektur. (Screenshot: Golem.de)

Pascal soll mit den neuen Techniken im Jahr 2016 erscheinen. Über die Zahl seiner Rechenwerke und die verwendete Strukturbreite sagte Huang noch nichts. Vermutlich wird auch Pascal, wie schon weitere für 2014 erwartete Maxwell-GPUs, mit 20 Nanometern bei TSMC gefertigt werden.

Nachtrag vom 26. März 2014, 0:10 Uhr

NV-Link bietet Geschwindigkeiten von 80 bis 200 GByte/s. Die Verbindung arbeitet mit 1:1-Interconnects und nicht mit PCIe-Switches.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Plitti 29. Apr 2014

Ich denke schon das die Engines besser werden, weil die Entwickler dann wissen wie sie...

saithis 26. Mär 2014

Ich meinte auch nicht das Stacked Mamory an sich gestrichen wurde, sondern das eventuell...

as (Golem.de) 25. Mär 2014

Hallo, das geht nicht, stimmt. Danke für den Hinweis, ich habe die falsche Wortwahl...

nie (Golem.de) 25. Mär 2014

Der Witz ist: Der 5-Millionen-Rechner, Google Brain, kann inzwischen nach einem Tag...



Aktuell auf der Startseite von Golem.de
T-1000
Roboter aus Metall kann sich verflüssigen

Ein Team aus den USA und China hat einen Roboter entwickelt, der seinen Aggregatzustand von fest zu flüssig und zurück ändern kann.

T-1000: Roboter aus Metall kann sich verflüssigen
Artikel
  1. Trotz Exportverbot: Chinesische Kernforscher nutzen weiter US-Hardware
    Trotz Exportverbot
    Chinesische Kernforscher nutzen weiter US-Hardware

    An Chinas wichtigstes Kernforschungszentrum darf seit 25 Jahren keine US-Hardware geliefert werden. Dennoch nutzt es halbwegs aktuelle Xeons und GPUs.

  2. Apple: MacBook Pro braucht wegen Lieferproblemen nur kleine Kühler
    Apple
    MacBook Pro braucht wegen Lieferproblemen nur kleine Kühler

    In den neuen MacBook Pro mit M2 Pro und M2 Max sitzen kleinere Kühlkörper. Der Grund sind Probleme in der Lieferkette.

  3. Virtualisieren mit Windows, Teil 3: Betrieb und Pflege von VMs mit Hyper-V
    Virtualisieren mit Windows, Teil 3
    Betrieb und Pflege von VMs mit Hyper-V

    Hyper-V ist ein Hypervisor, um VMs effizient verwalten zu können. Trotz einiger weniger Schwächen ist es eine gute Virtualisierungssoftware, wir stellen sie in drei Teilen vor. Im letzten geht es um Betrieb und Pflege der VMs.
    Eine Anleitung von Holger Voges

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PCGH Cyber Week - Rabatte bis 50% • Acer Predator 32" WQHD 170Hz 529€ • MindStar-Tiefstpreise: MSI RTX 4090 1.982€, Sapphire RX 7900 XT 939€ • Philips Hue bis -50% • Asus Gaming-Laptops bis -25% • XFX Radeon RX 7900 XTX 1.199€ • Kingston 2TB 112,90€ • Nanoleaf bis -25% [Werbung]
    •  /