Zum Hauptinhalt Zur Navigation

Blackwell Ultra für den Desktop: Verkauf von Nvidias DGX Station mit GB300 startet

GTC 2026
Ein Jahr nach Ankündigung kann Nvidias Workstation mit Server -Hardware bestellt werden. Nur ein Modell ist mit den beworbenen 288 GByte HBM ausgestattet.
/ Johannes Hiltscher
1 Kommentare News folgen (öffnet im neuen Fenster)
MSIs Xpertstation WS300 (Bild: MSI)
MSIs Xpertstation WS300 Bild: MSI

Vor einem Jahr hatte Nvidia im Rahmen der Hausmesse GTC 2025 mit der DGX Station ein leistungsfähiges Workstation-Mainboard vorgestellt . Seither war es ruhig um das Mainboard mit Grace-CPU und Blackwell-Ultra-GPU . Zur diesjährigen GTC 2026 hat Nvidia nun knapp angekündigt(öffnet im neuen Fenster) , dass die KI-Workstation vorbestellt werden kann.

Anders als bei der Mini-Workstation DGX Spark bietet Nvidia kein eigenes Modell an, sondern überlässt das Feld Vertriebspartnern. Systeme mit DGX-Station-Mainboard haben Dell mit dem Pro-Max GB300(öffnet im neuen Fenster) , Gigabyte mit dem W775-V10-L01(öffnet im neuen Fenster) , HP mit dem ZGX Fury(öffnet im neuen Fenster) , MSI mit der Xpertstation WS300(öffnet im neuen Fenster) und Supermicro mit dem ARS-511GD-NB-LCC(öffnet im neuen Fenster) .

Interessanterweise variiert die Speicherausstattung der GPU: Eigentlich sollte die mit 288 GByte HBM3e bestückt sein: acht Stacks zu 36 GByte. Mit Ausnahme von Dell geben aber alle Anbieter lediglich 252 GByte an. Das entspräche sieben 36-GByte-Stacks und passt zur niedrigeren angegebenen Bandbreite von 7,1 statt 8 TByte/s.

An die Grace-CPU sind bei allen Modellen 496 GByte LPDDR5X-6400-RAM in Form von vier SOCAMM-Riegeln angebunden. Auch ist standardmäßig eine Connect-X8-Netzwerkkarte mit zwei 400-GBit-Ethernet-Ports verbaut. So können bei Bedarf mehrere DGX-Stations vernetzt werden, um noch größere Modelle nutzen zu können oder Agentensystemen mehrere verschiedene Modelle bereitzustellen.

Große Modelle, keine Preise

Die Grace-CPU mit 72 Neoverse-V2-Kernen und die GB300-GPU sind per Nvlink-C2C (Chip-to-Chip) mit einer Bandbreite von 900 GByte/s verbunden. Das ermöglicht der GPU einen schnellen Zugriff auf den an die CPU angebundenen RAM, der allerdings auf eine Bandbreite von lediglich 396 GByte/s kommt.

Da CPU- und GPU-Speicher kohärent sind, können die Parameter von KI-Modellen in beiden Speichern abgelegt werden. Bei Quantisierung auf 4-Bit-Gleitkommazahlen (FP4) passen entsprechende Modelle mit rund einer Billion Parametern in den RAM.

Bei Verwendung von FP4 kommt die GB300-GPU auf eine Rechenleistung von 20 Petaflops, wenn Sparsity (g+) genutzt wird. Mit vollbesetzten Matrizen sind maximal 15 Pflops erreichbar. Die Leistungsaufnahme des DGX-Station-Mainboards gibt Nvidia mit 1.600 W an.

Preise nennen alle Hersteller lediglich auf Anfrage, Vorbestellungen sind derzeit zudem teilweise nur aus den USA möglich. Auch zum Auslieferungstermin gibt es noch keine Angaben.


Relevante Themen