Zum Hauptinhalt Zur Navigation Zur Suche

RNG: Dank Zufall brauchen AWS-Rechenzentren viel weniger Switches

Zufällig verkabelte Switches gelten als heiliger Gral der Netzwerktechnik. Nur praktikabel waren sie bislang nicht – AWS-Forscher haben das geändert.
/ Johannes Hiltscher
11 Kommentare Auf Google folgen (öffnet im neuen Fenster)
Die AWS-Forscher Ratul Mahajan, Giacomo Bernardi und Seshadhri Comandur vor einem Shuffle Panel. (Bild: AWS)
Die AWS-Forscher Ratul Mahajan, Giacomo Bernardi und Seshadhri Comandur vor einem Shuffle Panel. Bild: AWS

Der Fat Tree(öffnet im neuen Fenster) ist in vielen Rechenzentren die Netzwerktopologie der Wahl. Das liegt weniger an besonderer Effizienz, sondern in erster Linie am einfachen, aber recht robusten Aufbau: Pakete werden so lange in Richtung der obersten Switch-Ebene, der Wurzel des Baums, geleitet, bis ein Switch erreicht ist, der eine Verbindung zum Ziel herstellen kann. Dann geht es wieder abwärts.

Effizienter wäre allerdings, das haben Mathematiker bereits Anfang der 1990er-Jahre gezeigt, eine zufällige Verkabelung der Switches. Lange galt dies jedoch als unpraktikabel, Forscher von Amazon Web Services (AWS) konnten die Probleme aber lösen. Bereits Ende 2024 setzten sie in einem Rechenzentrum bei Dublin das erste Netzwerk mit pseudozufälliger Verkabelung um. Veröffentlicht haben sie ihre Erkenntnisse aber erst kürzlich(öffnet im neuen Fenster).

Mittlerweile nutzt AWS die RNG (Resilient Network Graphs) genannte Topologie für den Großteil seiner neuen Rechenzentren. Denn sie soll bis zu 45 Prozent günstiger sein als ein vergleichbarer Fat Tree. Möglich ist das, da RNG wesentlich weniger Router benötigt – 69 Prozent weniger sollen es gegenüber dem Fat Tree sein, wobei der Durchsatz sogar noch um ein Drittel höher sein soll.

Pseudozufall vereinfacht die Installation

Die größten Herausforderungen zufälliger Netzwerktopologien sind der Verkabelungsaufwand und das Routing. Die Verkabelung löst AWS mittels sogenannter Shuffle Boxes.

Dabei handelt es um passive optische Router mit identischem internem Aufbau. Sie ermöglichen die einfache Installation zusätzlicher Server, da diese lediglich im jeweiligen Serverraum angeschlossen werden müssen. Jeder Raum bekommt einige untereinander verbundene Shuffle Boxes, was als Shuffle Panel bezeichnet wird.

Die Shuffle Panels verschiedener Räume werden zufällig miteinander verbunden, auch die Router werden zufällig an das jeweilige Panel angeschlossen. Für die Verbindung von Shuffle Boxes und den Anschluss von Routern sind jeweils eigene Ports vorgesehen. Ungenutzte Ports der Shuffle Boxes werden mit einem Shuffleback genannten Dongle bestückt, der das Signal einfach zu einem anderen Router umleitet. So entsteht eine pseudozufällige Topologie, die laut den Forschern die gleichen statistischen Eigenschaften aufweist wie ein tatsächlich zufälliger Aufbau.

Die Aufgabe der Shuffle Boxes ist, den Aufwand bei der Installation zusätzlicher Server zu minimieren. Wird ein neuer Serverraum installiert, muss das neue Shuffle Panel mit den bestehenden Räumen vernetzt werden. Neue Router hingegen werden einfach an das Panel angesteckt. Damit ist der Aufwand bei der Installation neuer Server nicht höher als beim Fat Tree.

Pakete werden ins Netzwerk gesprüht

Um die aufwendige Berechnung von Routen zu vereinfachen, haben die Forscher die Router in zwei Gruppen eingeteilt: Spray Router und Waypoint Router. Ein Paket wird zunächst zufällig an einen benachbarten Switch weitergeleitet (Spraying). Anschließend erfolgt zwar ebenfalls eine zufällige Weiterleitung, aber nur an Waypoint Router. Die sind in mehreren Ringen organisiert, was sicherstellt, dass das Paket mit jedem Hop näher ans Ziel gelangt.

Das Spraying führt dazu, dass eine große Anzahl an Routen genutzt wird – die Stärke zufälliger Topologien. So werden ausgefallene Router recht zuverlässig umgangen, die Last wird recht gleichmäßig auf das gesamte Netzwerk verteilt. Die Waypoints hingegen vermeiden, dass ein Paket zum Ausgangsrouter zurückgeschickt wird, was kürzestmögliche Routen ermöglicht. Gleichzeitig vermeidet das Konzept hohen Berechnungsaufwand, da die Waypoints lediglich statische Routing-Tabellen benötigen.

Umfangreich ausgeführt haben die Forscher das Konzept von RNG in einer bei Arxiv verfügbaren Veröffentlichung(öffnet im neuen Fenster). Hier geben sie auch Formeln zur Modellierung eines Netzwerks an.


Relevante Themen