Abo
  • Services:

Multi-Chip-Module: Nvidia arbeitet an MCM-basierter Grafik

Statt immer größere monolithische GPUs zu fertigen, geht Nvidia den Weg multipler Grafikchips auf einem Träger. Bisherige Designs sollen recht gut skalieren, ermöglichen eine extrem hohe Leistung und sind vergleichsweise günstig zu produzieren.

Artikel veröffentlicht am ,
MCM mit mehreren Dies
MCM mit mehreren Dies (Bild: Nvidia)

Nvidia hat eine Studie veröffentlicht, die sich mit der Skalierung von Multi-Chip-Module-GPUs beschäftigt (PDF). Hintergrund ist, dass Moore's Law weniger schnell voranschreitet als in den vergangenen Jahren. GPU-Hersteller müssen über längere Zeiträume mit den gleichen Herstellungsverfahren arbeiten, was die Anzahl der Transistoren und die mögliche Die-Fläche begrenzt. Nvidias aktueller GV100-Chip fällt mit 815 mm² so monströs aus, dass der Interposer für die GPUs und die vier HBM2-Speicherstapel in zwei Schritten belichtet werden muss, da er die Dimensionen der Maske sprengt.

  • Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
  • Der Prototyp nutzt vier 64-SM-Chips und Stacked-Memory. (Bild: Nvidia)
  • Er kommt somit auf 256 SMs und 3 TByte/s an Bandbreite. (Bild: Nvidia)
  • Nicht alle Anwendungen skalieren mit so vielen Rechenkernen. (Bild: Nvidia)
  • Dennoch ist ein 256-SM-Chip kaum langsamer als sein monolithisches Pendant. (Bild: Nvidia)
Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
Stellenmarkt
  1. Stiegelmeyer GmbH & Co. KG, Herford
  2. Dataport, verschiedene Standorte

Um diesem Dilemma zu entkommen, sind Multi-Chip-Modules (MCMs) längst eine übliche Herangehensweise. AMDs Naples alias Epyc etwa besteht aus vier Chips, die innerhalb eines Packages zu einem Prozessor zusammengeschaltet sind, und Intel hat die Embedded Multi Die Interconnect Bridge (EMIB) entwickelt, um multiple Dies zu verbinden. Vorteil ist, dass sich mehrere kleine Chips günstiger fertigen lassen als große monolithische - einerseits aufgrund der Ausbeute (Yield), anderseits durch das Verwenden älterer Prozesse.

256 SMs sind schneller als 2 x 128

Das von Nvidia entwickelte MCM besteht aus 4 GPUs mit jeweils 64 Shader-Multiprozessoren und 2 DRAM-Speicherstapeln für 3 TByte/s an Bandbreite. Im Rahmen des Papers geht der Hersteller davon aus, dass Chips mit mehr als 128 Shader-Multiprozessoren aufgrund des Maskenlimits nicht herstellbar sind - der aktuelle GV100 weist 84 SMs auf, noch mehr Rechenkerne sind erst mit kommenden Prozessen wie 10 nm oder 7 nm realistisch.

Das MCM mit insgesamt 256 Shader-Multiprozessoren ist dank eines zusätzlichen L1.5-Caches kaum langsamer als eine monolithische GPUs mit gleicher Shader-Anzahl und um rund ein Viertel schneller als eine optimierte SLI-Kombination aus zwei 128-SM-Karten. Problematisch ist hierbei, dass nur ein Teil der Software über solch eine Menge an Rechenwerken skaliert.



Anzeige
Spiele-Angebote
  1. 32,25€ (5% Extra-Rabatt mit Gutschein GRCCIVGS (Uplay-Aktivierung))
  2. 59,99€ mit Vorbesteller-Preisgarantie (Release 26.02.)
  3. (-62%) 11,50€
  4. 23,49€

Schatzueh 05. Jul 2017

Ich spiele ja auch gerne mal alte Spiele und so weiter, bin ja auch schon einer der etwas...


Folgen Sie uns
       


Bright Memory Episode 1 - 10 Minuten Gameplay

Wir zeigen die ersten 10 Minuten von Bright Memory, dem actionreichen Indie-Ego-Shooter mit spektakulären Schwertkampf-Einlagen.

Bright Memory Episode 1 - 10 Minuten Gameplay Video aufrufen
Raspberry Pi: Spieglein, Spieglein, werde smart!
Raspberry Pi
Spieglein, Spieglein, werde smart!

Ein Spiegel, ein ausrangierter Monitor und ein Raspberry Pi sind die grundlegenden Bauteile, mit denen man sich selbst einen Smart Mirror basteln kann. Je nach Interesse können dort dann das Wetter, Fahrpläne, Nachrichten oder auch stimmungsvolle Bilder angezeigt werden.
Eine Anleitung von Christopher Bichl

  1. IoT mit LoRa und Raspberry Pi Die DNA des Internet der Dinge
  2. Bewegungssensor auswerten Mit Wackeln programmieren lernen
  3. Raspberry Pi Cam Babycam mit wenig Aufwand selbst bauen

Chromebook Spin 13 im Alltagstest: Tolles Notebook mit Software-Bremse
Chromebook Spin 13 im Alltagstest
Tolles Notebook mit Software-Bremse

Bei Chromebooks denken viele an billige, knarzende Laptops - das Spin 13 von Acer ist anders. Wir haben es einen Monat lang verwendet - und uns am Ende gefragt, ob der veranschlagte Preis für ein Notebook mit Chrome OS wirklich gerechtfertigt ist.
Ein Test von Tobias Költzsch


    Mac Mini mit eGPU im Test: Externe Grafik macht den Mini zum Pro
    Mac Mini mit eGPU im Test
    Externe Grafik macht den Mini zum Pro

    Der Mac Mini mit Hexacore-CPU eignet sich zwar gut für Xcode. Wer eine GPU-Beschleunigung braucht, muss aber zum iMac (Pro) greifen - oder eine externe Grafikkarte anschließen. Per eGPU ausgerüstet wird der Mac Mini viel schneller und auch preislich kann sich das lohnen.
    Ein Test von Marc Sauter

    1. Apple Mac Mini (Late 2018) im Test Tolles teures Teil - aber für wen?
    2. Apple Mac Mini wird grau und schnell
    3. Neue Produkte Apple will Mac Mini und Macbook Air neu auflegen

      •  /