Zum Hauptinhalt Zur Navigation

NASA-Forschungslabor mit riesiger 64-Bit-Linux-Installation

Hochleistungsrechnen mit 256-CPU-Shared-Memory-System. Ein 64-Bit-SGI-Altix-System, bei dem insgesamt 256 Prozessoren in einer Architektur mit globalem Shared-Memory betrieben wurden und die somit alle direkt auf einen einzigen großen, zusammenhängenden Hauptspeicher zuarbeiten konnten, setzte unter Linux neue Rekordmarken bei Skalierbarkeit und dauerhaft erbrachter Applikationsleistung.
/ Andreas Donath
Kommentare News folgen (öffnet im neuen Fenster)

Die SGI-Plattform ist Bestandteil der Infrastruktur für High-Performance-Computing (HPC) an der Forschungsinstitution NASA Ames. Die 256-Prozessor-Maschine wurde von NASA-Forschern in eigener Initiative aus zwei 128-CPU-Einzelsystemen, die sich ihrerseits noch im Erprobungsstadium befinden, zusammengeschaltet. Sie stellt die weltweit größte Single-System-Image-(SSI-)Maschine dar, die jemals unter Linux zum Einsatz kam.

SGI plant mit seinem 128p-SSI-Beta-Programm, die Skalierbarkeit in einem Linux-Einzelsystem noch weiter in die Höhe zu treiben. Das Ziel: Am Markt verfügbare SGI-Altix-Systeme sollen in einer einzigen Linux-Partition statt derzeit maximal 64 bald schon bis zu 128 Intel-Itanium-2-Prozessoren betreiben können.

Die am NASA Ames Research Center verbuchten Rechenergebnisse wurden im Rahmen eines NASA-weiten Forschungsprogramms erzielt, das die Anwender bei ihren geowissenschaftlichen, hochgradig komplexen Aufgabenstellungen zu deutlich schnelleren Problemlösungen führen soll. Beteiligt am Programm sind neben NASA Ames noch zwei weitere Institutionen der US-Weltraumbehörde, das Goddard Space Flight Center und das Jet Propulsion Laboratory (JPL).

Um die Leistungsfähigkeit und Skalierbarkeit des Systems zu demonstrieren, wählte man die Applikation ECCO ("Estimating the Circulation and Climate of the Ocean") – ein gemeinschaftliches Entwicklungsprodukt des MIT (Massachusetts Institute of Technology), des NASA JPL und der Scripps Institution of Oceanography. ECCO wird genutzt, um großräumige ozeanische Dynamikprozesse besser verstehen zu können; das Programm bezieht umfangreiche Beobachtungsdaten von Satelliten und hydrographischen In-situ-Messungen mit in die Rechenläufe ein.

ECCO lief auf dem 256-Prozessor-Altix-System bei der NASA Ames mit einem numerischen Modell, das die ozeanischen Zirkularströmungen über den kompletten Erdball hinweg mit einer Auflösung von einem Viertel Grad abbildet. Dabei verbuchten die Forscher auf der 64-Bit-Linux-Maschine einen Output, der ihnen pro "Wallclock"-Tag (also pro 24 Stunden Systemlaufzeit) das Berechnungsresultat für 1,4 simulierte Modelljahre lieferte. Das ist das schnellste Ergebnis, das nach Angaben der Forscher mit ECCO bis dato auf irgendeinem System erzielt wurde.

Die NASA verfolgte die Implementierung eines 256-Prozessor-Shared-Memory-Systems, weil viele ihrer zentral relevanten Production-Codes für Shared-Memory-Verarbeitung optimiert sind. Nach Forscherberichten ergeben sich mit dem Einsatz dieser Codes auf einem 256-Prozessor-Shared-Memory-System unmittelbar Skalierbarkeitsvorteile; Portierungs- oder Tuning-Aufwand, so ihre Erfahrung, ist nur wenig oder gar nicht erforderlich.


Relevante Themen