Blackwell Ultra für den Desktop: Verkauf von Nvidias DGX Station mit GB300 startet
Vor einem Jahr hatte Nvidia im Rahmen der Hausmesse GTC 2025 mit der DGX Station ein leistungsfähiges Workstation-Mainboard vorgestellt . Seither war es ruhig um das Mainboard mit Grace-CPU und Blackwell-Ultra-GPU . Zur diesjährigen GTC 2026 hat Nvidia nun knapp angekündigt(öffnet im neuen Fenster) , dass die KI-Workstation vorbestellt werden kann.
Anders als bei der Mini-Workstation DGX Spark bietet Nvidia kein eigenes Modell an, sondern überlässt das Feld Vertriebspartnern. Systeme mit DGX-Station-Mainboard haben Dell mit dem Pro-Max GB300(öffnet im neuen Fenster) , Gigabyte mit dem W775-V10-L01(öffnet im neuen Fenster) , HP mit dem ZGX Fury(öffnet im neuen Fenster) , MSI mit der Xpertstation WS300(öffnet im neuen Fenster) und Supermicro mit dem ARS-511GD-NB-LCC(öffnet im neuen Fenster) .
Interessanterweise variiert die Speicherausstattung der GPU: Eigentlich sollte die mit 288 GByte HBM3e bestückt sein: acht Stacks zu 36 GByte. Mit Ausnahme von Dell geben aber alle Anbieter lediglich 252 GByte an. Das entspräche sieben 36-GByte-Stacks und passt zur niedrigeren angegebenen Bandbreite von 7,1 statt 8 TByte/s.
An die Grace-CPU sind bei allen Modellen 496 GByte LPDDR5X-6400-RAM in Form von vier SOCAMM-Riegeln angebunden. Auch ist standardmäßig eine Connect-X8-Netzwerkkarte mit zwei 400-GBit-Ethernet-Ports verbaut. So können bei Bedarf mehrere DGX-Stations vernetzt werden, um noch größere Modelle nutzen zu können oder Agentensystemen mehrere verschiedene Modelle bereitzustellen.
Große Modelle, keine Preise
Die Grace-CPU mit 72 Neoverse-V2-Kernen und die GB300-GPU sind per Nvlink-C2C (Chip-to-Chip) mit einer Bandbreite von 900 GByte/s verbunden. Das ermöglicht der GPU einen schnellen Zugriff auf den an die CPU angebundenen RAM, der allerdings auf eine Bandbreite von lediglich 396 GByte/s kommt.
Da CPU- und GPU-Speicher kohärent sind, können die Parameter von KI-Modellen in beiden Speichern abgelegt werden. Bei Quantisierung auf 4-Bit-Gleitkommazahlen (FP4) passen entsprechende Modelle mit rund einer Billion Parametern in den RAM.
Bei Verwendung von FP4 kommt die GB300-GPU auf eine Rechenleistung von 20 Petaflops, wenn Sparsity (g+) genutzt wird. Mit vollbesetzten Matrizen sind maximal 15 Pflops erreichbar. Die Leistungsaufnahme des DGX-Station-Mainboards gibt Nvidia mit 1.600 W an.
Preise nennen alle Hersteller lediglich auf Anfrage, Vorbestellungen sind derzeit zudem teilweise nur aus den USA möglich. Auch zum Auslieferungstermin gibt es noch keine Angaben.
- Anzeige Hier geht es zu NVIDIA-Grafikkarten bei Alternate Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.