Ein neues Netz, das Petabytes zerlegen kann
Golem.de: Herr Prof. Dr. Reinefeld, das Schlagwort "Grid" macht derzeit in der IT-Branche die Runde. Für große Konzerne wie IBM oder Sun liegen hier potenziell neue, riesige Absatzmärkte. Hype oder schon Realität?
Prof. Dr. Alexander Reinefeld: Die Zeiten, in denen nur ein paar vereinzelte Wissenschaftler ihre Rechner zu so genannten "Computational Grids" zusammengeschaltet haben, sind vorbei: Das Grid Computing steht nun unmittelbar vor dem Einsatz – nicht nur im technisch/wissenschaftlichen, sondern auch im kommerziellen Umfeld. Die Firmen haben die Marktrelevanz erkannt und in den letzten zwei Jahren zunehmend auch in den eigenen Forschungsabteilungen Grid-Systeme entwickelt. Das war nicht immer so. Etwa Mitte der neunziger Jahre waren die Firmen überwiegend nur als Beobachter an den durch die akademischen Partner geprägten Grid-Projekten beteiligt.
Golem.de: Derzeit herrscht ja noch einige Begriffsverwirrung. Wie würden Sie einem Laien den Begriff des Grid erklären?
Reinefeld: Das ist eine sehr schwierige Frage. Manche sehen das Grid als "Next Generation Internet". Ich würde nicht soweit gehen. Es ist ja keine Revolution, sondern vielmehr eine Evolution durch die Nutzung der heute schon zur Verfügung stehenden Infrastruktur, nämlich der schnellen weltweiten Datennetze und der Rechen-Ressourcen. Ich verwende hier gerne den Begriff "Ressourcen", weil es im Grid-Computing nicht nur um Rechenleistung geht, sondern auch um die Verknüpfung und effiziente Nutzung anderer verteilter Ressourcen: große Archivspeicher, teure Visualisierungssysteme, Spezialrechner, spezielle Datenquellen (z.B. Teilchendetektoren am CERN, Satellitendaten, Sequenzier-Roboter) sowie letztlich auch menschliche Expertise, die vor Ort nicht verfügbar ist. Der entscheidende Punkt beim Grid liegt in der Middleware, durch die diese Ressourcen effizient genutzt werden kann.
Golem.de: Wie weit sind die heutigen Grids denn bereits vom Experimentierstadium entfernt?
Reinefeld: Wir befinden uns gerade in einer äußerst spannenden Phase, der zwischen Forschung und Anwendung. Die Forschungs- und Entwicklungsphase, die in den frühen neunziger Jahren begonnen hat, ist nun größtenteils abgeschlossen. Als Ergebnis existieren nun einige Grid-Softwarepakete, die auf die jeweilige Anwendung angepasst werden müssen, was mühsam und zeitaufwendig ist. Die Amerikaner sprechen hier von Toolsets, deren einzelne Werkzeuge (Tools) zu einer funktionierenden Einheit zusammengesetzt werden müssen.
Wie immer in solchen Situationen, steht nun die Standardisierung im Vordergrund, damit zukünftig Softwarentwickler auf dem Erreichten aufbauen können. Derzeit wird viel über Web-Services diskutiert, die auch zunehmend in Business-to-Business-Anwendungen eingesetzt werden. Durch Verwendung des XML-Datenstandards stellen Web-Services Hardware- und Betriebssystem-unabhängige Dienste zur Verfügung. Ein wichtiges Schlagwort ist hier "OGSA" (Open Grid Service Architecture).
Golem.de: Wo findet die Grid-Technologie in der Forschung inzwischen Anwendung?
Reinefeld: Das weltweit wichtigste Grid-Projekt kommt diesmal nicht aus den USA, sondern aus Europa. Es handelt sich um das europäische "DataGrid"-Projekt, das vom CERN initiiert und koordiniert wird. Hintergrund des Projekts ist die baldige Inbetriebnahme des neuen LHC-Teilchenbeschleunigers in Genf. Diese Anlage wird mehrere Petabyte Daten (Millionen von Gigabte) pro Jahr erzeugen. Diese Flut von Daten ist so groß, dass sie nicht an zentraler Stelle verarbeitet werden kann. Damit ist DataGrid das weltweit erste Projekt, das zwingend auf Grid-Computing angewiesen ist. Neben mehreren anderen europäischen Forschungsgruppen arbeiten auch wir an diesem von der EU geförderten Projekt mit. Unsere Aufgabe besteht in der effizienten Einbindung von PC-Clustern in die Grid-Software-Umgebung.
Golem.de: Welche Vorteile hat dies – was können Wissenschaftler tun, was sie vorher nicht konnten?
Reinefeld: Zunächst einmal bietet das Grid Zugriff auf entfernte Hochleistungsrechner, die vor Ort nicht zur Verfügung stehen. Dadurch erhalten Wissenschaftler neue Möglichkeiten, größere und genauere Simulationsrechnungen durchführen zu können. Wichtig ist aber auch der Daten-Aspekt: Im bereits genannten DataGrid-Projekt werden mehrere tausend Physiker in ganz Europa an den gleichen Daten arbeiten können, die von den Teilchendetektoren erzeugt und in speziellen Datenzentren im Grid verteilt wurden. Die Simulationsergebnisse werden wiederum im Grid abgelegt und können so gemeinsam ausgewertet werden – ein echter Fortschritt der internationalen Zusammenarbeit. Dies ist natürlich nicht nur auf die Teilchenphysik anwendbar.
Golem.de: Wann sehen Sie erste praktische Anwendungen für die Wirtschaft?
Reinefeld: Wir stehen unmittelbar davor. Die Wirtschaft wird sehr bald von der Grid-Technologie profitieren, weil ihre vorhandenen B2B-Anwendungen auf denselben Web-Services basieren, die im Grid-Bereich angewandt werden.
Golem.de: Wo konkret werden die liegen?
Reinefeld: Die Europäische Union fördert derzeit bereits einige Grid-Projekte mit direkter Industrierelevanz. So sind wir beispielsweise an einem Projekt beteiligt, das von Schiffskonstrukteuren und Entwicklern der Automobilindustrie initiiert wurde, die über eine Grid-Umgebung Zugriff auf komplexe Strömungssimulationsprogramme benötigen. Diese Anwendungen laufen nur auf Hochleistungsrechnern, deren Betrieb sich die Anwender jedoch nicht leisten können oder wollen. Das Grid bietet ihnen die Gelegenheit, gegen Kostenbeteiligung Zugriff auf diese komplexen Anwendungen und Rechner zu erhalten. Ähnliche Projekte existieren im Arzneimittel-Design, in der Materialforschung (KfZ-Industrie), in der chemischen Forschung usw. Die EU hat hier die wichtige Rolle der Anschubfinanzierung übernommen. Ich erwarte von einigen Projekten einen durchschlagenden Erfolg, was weitere industriefinanzierte Projekte nach sich ziehen wird.
Golem.de: Sind Grids eine Nachfolgetechnologie des Internet?
Reinefeld: Ich denke, sie sind die logische Fortsetzung. Während das derzeitige Internet Daten und Informationen bereithält, wird das Grid individuell aufbereitete Ergebnisse zur Verfügung stellen. Es handelt sich also um einen höherwertigen Dienst.
Golem.de: Inwieweit kann man bei heutigen "Distributed Computing"-Anwendungen bereits von einem Grid sprechen?
Reinefeld: Im Begriff "Distributed Computing" liegt der Fokus auf den verteilt ablaufenden Anwendungen. Der Begriff "Grid" umfasst mehr. Hier werden auch Probleme gelöst, wie z.B. "Welche Dienste sind überhaupt verfügbar?", "Wo finde ich sie?", "Wie kann ich sie nutzen?", "Wie erhalte ich meine Ergebnisse zurück?".
Golem.de: Müssen Grids immer zusammenhängende Großrechner darstellen?
Reinefeld: Nein, überhaupt nicht. Großrechner werden im Allgemeinen für eine (weitgehend) lokale Nutzerschaft angeschafft, die diese teuren Systeme dann mit ihren Programmen meistens vollständig auslastet, so dass keine Rechenzeit mehr für Grid-Anwendungen übrig bleibt. Es zeichnet sich daher ein Trend zur Nutzung preiswerter PC-Cluster als Rechenknoten im Grid ab. Das DataGrid-Projekt des CERN ist ein gutes Beispiel hierfür. Dort werden etwa 50.000 PCs weltweit verteilt betrieben, wobei jeweils etwa tausend PCs zu großen Cluster-Farmen zusammengefasst werden. Die Cluster-Technologie spielt also eine große Rolle in Grid.
Golem.de: Was erwarten Sie von der "CCGrid"-Konferenz, der Sie zusammen mit Prof. Dr.-Ing. Klaus-Peter Löhr von der FU Berlin vorsitzen?
Reinefeld: Cluster Computing und der Einsatz von Grid-Technologien sind zwei sehr wichtige Strömungen der Informatik in diesem Jahrzehnt. Auf der CCGrid2002 werden Spitzenforscher aus beiden Gebieten zusammenkommen, um die Forschung und Entwicklung in diesen beiden Gebieten zu diskutieren. Neben den führenden Wissenschaftlern, die aus aller Welt zu dieser Konferenz nach Berlin kommen, ist die hohe Industriebeteiligung diesmal besonders bemerkenswert. Sie zeigt die hohe Relevanz des Themas auch außerhalb der Forschung. Außerdem sind wir besonders stolz, dass wir die CCGrid – nach Brisbane im letzten Jahr und vor Tokio im nächsten Jahr – als eine der wenigen wirklich weltumspannenden Konferenzen in diesem Jahr nach Berlin holen konnten.
Golem.de: Herr Prof. Dr. Reinfeld, wir bedanken uns für das Gespräch.
[Das Interview führte Ben Schwan.]