Mit E-Auto-Technik: Google plant 1-MW-Server-Racks

Die Entwicklung der KI-Beschleuniger treibt die Rechenzentrumsinfrastruktur vor sich her: Immer höhere Leistungsdichte und engere Packung machen neue Ansätze beim Aufbau von Racks und Rechenzentren erforderlich. Während einige noch über die 120 kW Leistungsaufnahme eines NVL72-Racks staunen, rechnet Google mit 500 kW pro Rack bis 2030(öffnet im neuen Fenster) - und mehr.
Denn das Konzept Mount Diablo, das die Ingenieure von Google Cloud aktuell mit Meta und Microsoft(öffnet im neuen Fenster) entwickeln, soll bis zu 1 MW pro Rack ermöglichen. Beim 2025 EMEA Summit(öffnet im neuen Fenster) (Europe, Middle East, Africa) des Open Compute Project (OCP) erklärten sie, wie das funktionieren soll. Um so viel Leistung überhaupt ins Rack zu bringen, soll die Versorgungsspannung deutlich steigen: Von aktuell 48 Volt auf +/- 400 Volt Gleichstrom - was der Systemspannung vieler Elektroautos entspricht.
Diese Wahl ist kein Zufall: Googles Ingenieure wollen für ihre Server für Elektroautos entwickelte Hardware nutzen und damit Kosten sparen. Ein weiterer Vorteil der höheren Versorgungsspannung ist, dass mindestens eine Spannungswandlung entfällt(öffnet im neuen Fenster) , was einen Effizienzgewinn und geringere Kosten bedeutet. Neu ist die Idee übrigens nicht - diskutiert werden solche Hochvoltsysteme seit mehr als einem Jahrzehnt(öffnet im neuen Fenster) , entsprechende Lösungen werden bereits angeboten(öffnet im neuen Fenster) .
Alles raus, was nicht rechnet
Das zweite Ziel von Mount Diablo ist, möglichst viel Rechenleistung in ein Rack zu packen. Dazu werden alle für den Betrieb erforderlichen, nicht rechnenden Komponenten in eigene Racks verbannt: Das Wandlersystem, welches den Gleichstrom bereitstellt, versorgt ebenso wie Coolant Distribution Unit (CDU) und USV (unterbrechungsfreie Stromversorgung) eine Reihe an Racks. Die enthalten nur noch CPUs oder Beschleuniger sowie die unmittelbar erforderliche Elektronik und Kühlung.
Die CDU trennt den Kühlkreis der einzelnen Racks vom Hauptkühlkreis des Rechenzentrums. Bei vollständig wassergekühlten Systemen, wie sie auch etwa beim wissenschaftlichen Rechnen (HPC, High Performance Computing) genutzt werden , enthält üblicherweise jedes Rack eine eigene CDU. Google entwickelte mit Project Deschutes ein eigenes System mit redundanten Pumpen und Wärmetauschern. Es hat die Maße eines 19-Zoll-Racks, wird seit der dritten Generation mit den selbst entwickelten Tensor Processing Units (TPUs) genutzt und soll eine Verfügbarkeit von 99,999 Prozent erreichen.
Da die Entwicklung im Rahmen des OCP erfolgt, werden die Entwürfe veröffentlicht - Version 0.5 des Mount-Diablo-Systems soll noch im Mai 2025 zugänglich gemacht werden.



