GPU System Processor: Nvidia nutzt interne Grafikkarten-CPU als Beschleuniger

Nvidia hat damit begonnen, den in den meisten Turing- und Ampere-Grafikchips vorhandenen GPU System Processor (GSP) zur Performance-Steigerung zu nutzen. Unter Linux wird dieser mit dem Display-Treiber 510.39(öffnet im neuen Fenster) für Server- und Workstation-Modelle freigeschaltet, unter Windows soll er offenbar als Teil des CPU Optimizer von Max-Q v4 für Laptop-Geforce-Ableger eingesetzt werden.
Beim GPU System Processor(öffnet im neuen Fenster) , der auch vom CUDA 11.6 Toolkit(öffnet im neuen Fenster) unterstützt wird, handelt es sich um einen Funktionsblock innerhalb des Grafikchips. Laut Firmware handelt es sich um einen RISC-V-basierten Controller, höchstwahrscheinlich den Peregrine (ein RV64IMCF-Design), welcher seit 2017 den älteren ARM-basierten Falcon ersetzt hat.
Laut den Beschreibungen von Nvidia fungiert der GSP in einigen Fällen als Offloading-Prozessor für Aufgaben, die ansonsten vom Treiber auf der regulären System-CPU ausführt werden. Aufgrund der niedrigeren Latenzen des GSP beim Zugriff auf GPU-interne Ressourcen soll die Performance bei deren Initialisierung und bei Steuerungsaufgaben steigen, Nvidia nennt allerdings keine Zahlen.
CPU Optimizer von Max-Q v4
Unter Linux wird der GPU System Processor primär für Server- und Workstation-Modelle verwendet, darunter die Tesla T4/T10 und die Tesla A100/PG506 sowie kleinere Varianten wie Tesla A40/A30/A16/A2. Ein weiterer Einsatzzweck für den GSP scheint der CPU Optimizer von Max-Q v4(öffnet im neuen Fenster) zu sein, der mit den Geforce RTX 3080/3070 Ti für Laptops eingeführt wurde. Dank diesem kann sich der Grafikchip bis zu 25 Watt vom Power-Budget des System-Prozessors borgen, wenn dieser vergleichsweise wenig belastet ist.
Damit das klappt, hat Nvidia unter anderem einen CPU Deep Sleep für den Treiber entwickelt und nutzt anscheinend den GSP als Offloading-Beschleuniger; hier als Command Processor bezeichnet. Als Beispiel nennt Nvidia die Befehlsvalidierung durch das Verifizieren von Pointern, welche häufig vorkommt.
Mit Hilfe des CPU Optimizers soll die System-CPU rund 20 Watt weniger benötigen, was wiederum der Geforce-Grafik zugute kommt und so die Bildrate in Spielen wie The Witcher 3 um bis zu 17 Prozent steigt.



