• IT-Karriere:
  • Services:

Multi-Chip-Module: Nvidia arbeitet an MCM-basierter Grafik

Statt immer größere monolithische GPUs zu fertigen, geht Nvidia den Weg multipler Grafikchips auf einem Träger. Bisherige Designs sollen recht gut skalieren, ermöglichen eine extrem hohe Leistung und sind vergleichsweise günstig zu produzieren.

Artikel veröffentlicht am ,
MCM mit mehreren Dies
MCM mit mehreren Dies (Bild: Nvidia)

Nvidia hat eine Studie veröffentlicht, die sich mit der Skalierung von Multi-Chip-Module-GPUs beschäftigt (PDF). Hintergrund ist, dass Moore's Law weniger schnell voranschreitet als in den vergangenen Jahren. GPU-Hersteller müssen über längere Zeiträume mit den gleichen Herstellungsverfahren arbeiten, was die Anzahl der Transistoren und die mögliche Die-Fläche begrenzt. Nvidias aktueller GV100-Chip fällt mit 815 mm² so monströs aus, dass der Interposer für die GPUs und die vier HBM2-Speicherstapel in zwei Schritten belichtet werden muss, da er die Dimensionen der Maske sprengt.

  • Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
  • Der Prototyp nutzt vier 64-SM-Chips und Stacked-Memory. (Bild: Nvidia)
  • Er kommt somit auf 256 SMs und 3 TByte/s an Bandbreite. (Bild: Nvidia)
  • Nicht alle Anwendungen skalieren mit so vielen Rechenkernen. (Bild: Nvidia)
  • Dennoch ist ein 256-SM-Chip kaum langsamer als sein monolithisches Pendant. (Bild: Nvidia)
Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
Stellenmarkt
  1. Landeshauptstadt Stuttgart, Stuttgart
  2. Allianz Deutschland AG, München Unterföhring

Um diesem Dilemma zu entkommen, sind Multi-Chip-Modules (MCMs) längst eine übliche Herangehensweise. AMDs Naples alias Epyc etwa besteht aus vier Chips, die innerhalb eines Packages zu einem Prozessor zusammengeschaltet sind, und Intel hat die Embedded Multi Die Interconnect Bridge (EMIB) entwickelt, um multiple Dies zu verbinden. Vorteil ist, dass sich mehrere kleine Chips günstiger fertigen lassen als große monolithische - einerseits aufgrund der Ausbeute (Yield), anderseits durch das Verwenden älterer Prozesse.

256 SMs sind schneller als 2 x 128

Das von Nvidia entwickelte MCM besteht aus 4 GPUs mit jeweils 64 Shader-Multiprozessoren und 2 DRAM-Speicherstapeln für 3 TByte/s an Bandbreite. Im Rahmen des Papers geht der Hersteller davon aus, dass Chips mit mehr als 128 Shader-Multiprozessoren aufgrund des Maskenlimits nicht herstellbar sind - der aktuelle GV100 weist 84 SMs auf, noch mehr Rechenkerne sind erst mit kommenden Prozessen wie 10 nm oder 7 nm realistisch.

Das MCM mit insgesamt 256 Shader-Multiprozessoren ist dank eines zusätzlichen L1.5-Caches kaum langsamer als eine monolithische GPUs mit gleicher Shader-Anzahl und um rund ein Viertel schneller als eine optimierte SLI-Kombination aus zwei 128-SM-Karten. Problematisch ist hierbei, dass nur ein Teil der Software über solch eine Menge an Rechenwerken skaliert.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. täglich neue Deals bei Alternate.de

Schatzueh 05. Jul 2017

Ich spiele ja auch gerne mal alte Spiele und so weiter, bin ja auch schon einer der etwas...


Folgen Sie uns
       


24-zu-10-Monitor LG 38GL950G - Test

LGs 21:9-Monitor 38GL950G überzeugt durch gute Farben und sehr gute Leistung in Spielen und beim Filmeschauen. Allerdings gibt es einige Probleme beim Übertakten des Panels.

24-zu-10-Monitor LG 38GL950G - Test Video aufrufen
Coronakrise: Die Maske schreibt mit
Coronakrise
Die Maske schreibt mit

Ein Startup aus Japan hat einen intelligenten Mundschutz entwickelt, der die Worte des Trägers aufnehmen, übersetzen und verschicken kann. Ein Problem gibt es aber bei der Zielgruppe.
Ein Bericht von Felix Lill

  1. Coronakrise Unternehmen könnten längerfristig auf Homeoffice setzen
  2. Curevac Tesla baut mobile Moleküldrucker für Corona-Impfstoff
  3. Jens Spahn Bislang 300 Infektionsmeldungen über Corona-Warn-App

Alloy Elite 2 im Test: Voll programmierbare Tastatur mit Weihnachtsbaumbeleuchtung
Alloy Elite 2 im Test
Voll programmierbare Tastatur mit Weihnachtsbaumbeleuchtung

HyperX verbaut in seiner neuen Gaming-Tastatur erstmals eigene Schalter und lässt der RGB-Beleuchtung sehr viel Raum. Die Verarbeitungsqualität ist hoch, der Preis angemessen.
Ein Test von Tobias Költzsch

  1. Ergonomische Tastatur im Test Logitech erfüllt auch kleine Wünsche
  2. Keyboardio Atreus Programmierbare ergonomische Mini-Tastatur für unterwegs
  3. Keychron K6 Kompakte drahtlose Tastatur mit austauschbaren Switches

Indiegames-Rundschau: Raumschiffknacker im Orbit
Indiegames-Rundschau
Raumschiffknacker im Orbit

Galaktischer Spielspaß in Hardspace Shipbreaker und Space Haven, Zauberei in West of Dead und Wildfire: Das bieten die Indiegames.
Von Rainer Sigl

  1. Rollenspiel Fans übersetzen Disco Elysium ins Deutsche
  2. Indiegames-Rundschau Einmal durchspielen in 400 Tagen
  3. A Maze Berliner Indiegames-Festival sucht Unterstützer

    •  /