Abo
  • IT-Karriere:

Multi-Chip-Module: Nvidia arbeitet an MCM-basierter Grafik

Statt immer größere monolithische GPUs zu fertigen, geht Nvidia den Weg multipler Grafikchips auf einem Träger. Bisherige Designs sollen recht gut skalieren, ermöglichen eine extrem hohe Leistung und sind vergleichsweise günstig zu produzieren.

Artikel veröffentlicht am ,
MCM mit mehreren Dies
MCM mit mehreren Dies (Bild: Nvidia)

Nvidia hat eine Studie veröffentlicht, die sich mit der Skalierung von Multi-Chip-Module-GPUs beschäftigt (PDF). Hintergrund ist, dass Moore's Law weniger schnell voranschreitet als in den vergangenen Jahren. GPU-Hersteller müssen über längere Zeiträume mit den gleichen Herstellungsverfahren arbeiten, was die Anzahl der Transistoren und die mögliche Die-Fläche begrenzt. Nvidias aktueller GV100-Chip fällt mit 815 mm² so monströs aus, dass der Interposer für die GPUs und die vier HBM2-Speicherstapel in zwei Schritten belichtet werden muss, da er die Dimensionen der Maske sprengt.

  • Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
  • Der Prototyp nutzt vier 64-SM-Chips und Stacked-Memory. (Bild: Nvidia)
  • Er kommt somit auf 256 SMs und 3 TByte/s an Bandbreite. (Bild: Nvidia)
  • Nicht alle Anwendungen skalieren mit so vielen Rechenkernen. (Bild: Nvidia)
  • Dennoch ist ein 256-SM-Chip kaum langsamer als sein monolithisches Pendant. (Bild: Nvidia)
Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
Stellenmarkt
  1. Allianz Deutschland AG, Stuttgart
  2. operational services GmbH & Co. KG, Braunschweig

Um diesem Dilemma zu entkommen, sind Multi-Chip-Modules (MCMs) längst eine übliche Herangehensweise. AMDs Naples alias Epyc etwa besteht aus vier Chips, die innerhalb eines Packages zu einem Prozessor zusammengeschaltet sind, und Intel hat die Embedded Multi Die Interconnect Bridge (EMIB) entwickelt, um multiple Dies zu verbinden. Vorteil ist, dass sich mehrere kleine Chips günstiger fertigen lassen als große monolithische - einerseits aufgrund der Ausbeute (Yield), anderseits durch das Verwenden älterer Prozesse.

256 SMs sind schneller als 2 x 128

Das von Nvidia entwickelte MCM besteht aus 4 GPUs mit jeweils 64 Shader-Multiprozessoren und 2 DRAM-Speicherstapeln für 3 TByte/s an Bandbreite. Im Rahmen des Papers geht der Hersteller davon aus, dass Chips mit mehr als 128 Shader-Multiprozessoren aufgrund des Maskenlimits nicht herstellbar sind - der aktuelle GV100 weist 84 SMs auf, noch mehr Rechenkerne sind erst mit kommenden Prozessen wie 10 nm oder 7 nm realistisch.

Das MCM mit insgesamt 256 Shader-Multiprozessoren ist dank eines zusätzlichen L1.5-Caches kaum langsamer als eine monolithische GPUs mit gleicher Shader-Anzahl und um rund ein Viertel schneller als eine optimierte SLI-Kombination aus zwei 128-SM-Karten. Problematisch ist hierbei, dass nur ein Teil der Software über solch eine Menge an Rechenwerken skaliert.



Anzeige
Spiele-Angebote
  1. (-69%) 12,50€
  2. 4,99€
  3. (-77%) 13,99€
  4. 4,60€

Schatzueh 05. Jul 2017

Ich spiele ja auch gerne mal alte Spiele und so weiter, bin ja auch schon einer der etwas...


Folgen Sie uns
       


Katamaran Energy Observer angesehen

Die Energy Observer ist ein Schiff, das ausschließlich mit erneuerbaren Energien betrieben wird und seinen Treibstoff zum Teil selbst produziert. Wir haben es in Hamburg besucht.

Katamaran Energy Observer angesehen Video aufrufen
5G-Report: Nicht jedes Land braucht zur Frequenzvergabe Auktionen
5G-Report
Nicht jedes Land braucht zur Frequenzvergabe Auktionen

Die umstrittene Versteigerung von 5G-Frequenzen durch die Bundesnetzagentur ist zu Ende. Die Debatte darüber, wie Funkspektrum verteilt werden soll, geht weiter. Wir haben uns die Praxis in anderen Ländern angeschaut.
Ein Bericht von Stefan Krempl

  1. Testlabor-Leiter 5G bringt durch "mehr Antennen weniger Strahlung"
  2. Sindelfingen Mercedes und Telefónica Deutschland errichten 5G-Netz
  3. iPhone-Modem Apple will Intels deutsches 5G-Team übernehmen

WD Blue SN500 ausprobiert: Die flotte günstige Blaue
WD Blue SN500 ausprobiert
Die flotte günstige Blaue

Mit der WD Blue SN500 bietet Western Digital eine spannende NVMe-SSD an: Das M.2-Kärtchen basiert auf einem selbst entwickelten Controller und eigenem Flash-Speicher. Das Resultat ist ein schnelles, vor allem aber günstiges Modell als bessere Alternative zu Sata-SSDs.
Von Marc Sauter

  1. WD Black SN750 ausprobiert Direkt hinter Samsungs SSDs
  2. WD Black SN750 Leicht optimierte NVMe-SSD mit 2 TByte
  3. Ultrastar DC ME200 Western Digital baut PCIe-Arbeitsspeicher mit 4 TByte

Ada und Spark: Mehr Sicherheit durch bessere Programmiersprachen
Ada und Spark
Mehr Sicherheit durch bessere Programmiersprachen

Viele Sicherheitslücken in Software sind auf Programmierfehler zurückzuführen. Diese Fehler lassen sich aber vermeiden - und zwar unter anderem durch die Wahl einer guten Programmiersprache. Ada und Spark gehören dazu, leider sind sie immer noch wenig bekannt.
Von Johannes Kanig

  1. Das andere How-to Deutsch lernen für Programmierer
  2. Programmiersprachen, Pakete, IDEs So steigen Entwickler in Machine Learning ein
  3. Software-Entwickler Welche Programmiersprache soll ich lernen?

    •  /