Abo
  • Services:

Multi-Chip-Module: Nvidia arbeitet an MCM-basierter Grafik

Statt immer größere monolithische GPUs zu fertigen, geht Nvidia den Weg multipler Grafikchips auf einem Träger. Bisherige Designs sollen recht gut skalieren, ermöglichen eine extrem hohe Leistung und sind vergleichsweise günstig zu produzieren.

Artikel veröffentlicht am ,
MCM mit mehreren Dies
MCM mit mehreren Dies (Bild: Nvidia)

Nvidia hat eine Studie veröffentlicht, die sich mit der Skalierung von Multi-Chip-Module-GPUs beschäftigt (PDF). Hintergrund ist, dass Moore's Law weniger schnell voranschreitet als in den vergangenen Jahren. GPU-Hersteller müssen über längere Zeiträume mit den gleichen Herstellungsverfahren arbeiten, was die Anzahl der Transistoren und die mögliche Die-Fläche begrenzt. Nvidias aktueller GV100-Chip fällt mit 815 mm² so monströs aus, dass der Interposer für die GPUs und die vier HBM2-Speicherstapel in zwei Schritten belichtet werden muss, da er die Dimensionen der Maske sprengt.

  • Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
  • Der Prototyp nutzt vier 64-SM-Chips und Stacked-Memory. (Bild: Nvidia)
  • Er kommt somit auf 256 SMs und 3 TByte/s an Bandbreite. (Bild: Nvidia)
  • Nicht alle Anwendungen skalieren mit so vielen Rechenkernen. (Bild: Nvidia)
  • Dennoch ist ein 256-SM-Chip kaum langsamer als sein monolithisches Pendant. (Bild: Nvidia)
Statt einer monolithischen GPU könnten MCMs die Zukunft sein (Bild: Nvidia)
Stellenmarkt
  1. Schaeffler Technologies AG & Co. KG, Schweinfurt
  2. DLR Deutsches Zentrum für Luft- und Raumfahrt e.V., Oberpfaffenhofen

Um diesem Dilemma zu entkommen, sind Multi-Chip-Modules (MCMs) längst eine übliche Herangehensweise. AMDs Naples alias Epyc etwa besteht aus vier Chips, die innerhalb eines Packages zu einem Prozessor zusammengeschaltet sind, und Intel hat die Embedded Multi Die Interconnect Bridge (EMIB) entwickelt, um multiple Dies zu verbinden. Vorteil ist, dass sich mehrere kleine Chips günstiger fertigen lassen als große monolithische - einerseits aufgrund der Ausbeute (Yield), anderseits durch das Verwenden älterer Prozesse.

256 SMs sind schneller als 2 x 128

Das von Nvidia entwickelte MCM besteht aus 4 GPUs mit jeweils 64 Shader-Multiprozessoren und 2 DRAM-Speicherstapeln für 3 TByte/s an Bandbreite. Im Rahmen des Papers geht der Hersteller davon aus, dass Chips mit mehr als 128 Shader-Multiprozessoren aufgrund des Maskenlimits nicht herstellbar sind - der aktuelle GV100 weist 84 SMs auf, noch mehr Rechenkerne sind erst mit kommenden Prozessen wie 10 nm oder 7 nm realistisch.

Das MCM mit insgesamt 256 Shader-Multiprozessoren ist dank eines zusätzlichen L1.5-Caches kaum langsamer als eine monolithische GPUs mit gleicher Shader-Anzahl und um rund ein Viertel schneller als eine optimierte SLI-Kombination aus zwei 128-SM-Karten. Problematisch ist hierbei, dass nur ein Teil der Software über solch eine Menge an Rechenwerken skaliert.



Anzeige
Spiele-Angebote
  1. 8,49€
  2. (-30%) 4,61€
  3. 44,99€
  4. 4,99€

Schatzueh 05. Jul 2017

Ich spiele ja auch gerne mal alte Spiele und so weiter, bin ja auch schon einer der etwas...


Folgen Sie uns
       


Intel NUC8 (Crimson Canyon) - Test

Der NUC8 alias Crimson Canyon ist der erste Mini-PC mit einem 10-nm-Chip von Intel. Dessen Grafikeinheit ist aber deaktiviert, weshalb Intel noch eine Radeon RX 540 verlötet. Leider steckt im System eine Festplatte, weshalb der NUC8 sehr träge reagiert und vergleichsweise laut wird.

Intel NUC8 (Crimson Canyon) - Test Video aufrufen
Adblock Plus: Adblock-Filterregeln können Code ausführen
Adblock Plus
Adblock-Filterregeln können Code ausführen

Unter bestimmten Voraussetzungen können Filterregeln für Adblocker mit einer neuen Funktion Javascript-Code in Webseiten einfügen. Adblock Plus will reagieren und die entsprechende Funktion wieder entfernen. Ublock Origin ist nicht betroffen.
Von Hanno Böck


    Fitbit Versa Lite im Test: Eher smartes als sportliches Wearable
    Fitbit Versa Lite im Test
    Eher smartes als sportliches Wearable

    Sieht fast aus wie eine Apple Watch, ist aber viel günstiger: Golem.de hat die Versa Lite von Fitbit ausprobiert. Neben den Sport- und Fitnessfunktionen haben uns besonders der Appstore und das Angebot an spaßigen und ernsthaften Anwendungen interessiert.
    Von Peter Steinlechner

    1. Smartwatch Fitbit stellt Versa Lite für Einsteiger vor
    2. Inspire Fitbits neues Wearable gibt es nicht im Handel
    3. Charge 3 Fitbit stellt neuen Fitness-Tracker für 150 Euro vor

    Raspi-Tastatur und -Maus im Test: Die Basteltastatur für Bastelrechner
    Raspi-Tastatur und -Maus im Test
    Die Basteltastatur für Bastelrechner

    Für die Raspberry-Pi-Platinen gibt es eine offizielle Tastatur und Maus, passenderweise in Weiß und Rot. Im Test macht die Tastatur einen anständigen Eindruck, die Maus hingegen hat uns eher kaltgelassen. Das Keyboard ist zudem ein guter Ausgangspunkt für Bastelprojekte.
    Ein Test von Tobias Költzsch

    1. Bastelcomputer Offizielle Maus und Tastatur für den Raspberry Pi
    2. Kodi mit Raspberry Pi Pimp your Stereoanlage
    3. Betriebssystem Windows 10 on ARM kann auf Raspberry Pi 3 installiert werden

      •  /