Zum Hauptinhalt Zur Navigation Zur Suche

Mit AMD, Nvidia, Broadcom: OCI-MSA definiert interoperables optisches Scale-up

Für mehr Bandbreite dürften KI -Chips bald optisch kommunizieren. Fast alle großen Hersteller von KI- Hardware haben sich auf einen Standard geeinigt.
/ Johannes Hiltscher
Kommentare undefined News folgen (öffnet im neuen Fenster)
Ganz klar: Hier kommuniziert AMD-Hardware. Ob Team Green seine eigene Farbe bekommt? (Bild: Christophe.Finot, Wikimedia Commons)
Ganz klar: Hier kommuniziert AMD-Hardware. Ob Team Green seine eigene Farbe bekommt? Bild: Christophe.Finot, Wikimedia Commons / CC-BY-SA 3.0

Noch erfolgt die Direktverbindung von KI-Chips im sogenannten Scale-up-Netzwerk elektrisch. Aktuell ist das die ökonomischere Lösung, doch mit immer weiter steigenden Bandbreitenanforderungen und größeren Scale-up-Dimensionen kommen elektrische Verbindungen an ihre Grenzen. Zudem werden optische Verbindungen dank Co-Packaged Optics energieeffizienter – ein Problem der klassischen SFP-Module.

Um nicht jeweils das Rad selbst zu erfinden, fanden sich eine Reihe von Herstellern im Optical Compute Interconnect Multi-Source Agreement(öffnet im neuen Fenster) (OCI-MSA) zusammen. Das Konsortium stellte eine erste Spezifikation für einen optischen Phy mit 200 GBit vor. Die Vereinheitlichung ermöglicht es den Mitgliedern, die gleichen Co-Packaged-Optics-Module zu verwenden. Das spart Entwicklungskosten. Zu den Gründungsmitgliedern zählen neben AMD, Broadcom und Nvidia noch Meta, Microsoft und OpenAI.

Der Standard ordnet sich auf Ebene 1 des OSI-Modells ein. Neben physikalischen Parametern wie Wellenlänge oder erlaubten Verlusten werden Mechanismen für Initialisierung und Diagnose definiert. Dazu gehören Testmuster für das Deskewing (Entzerren, Ausgleichen von Laufzeitunterschieden einzelner Kanäle), Mechanismen zur Initialisierung sowie Statusregister.

Die höheren Protokollebenen können die Mitglieder des Konsortiums frei definieren, Nvidia etwa kann also weiter Nvlink nutzen. Damit erstreckt sich die Interoperabilität rein auf die unterste Ebene des Netzwerk-Stacks.

Bidirektionale Fasern und Faserbündel

Der Standard nutzt Wavelength Division Multiplexing (WDM), um möglichst hohe Datenraten pro Lichtleiter zu erreichen: Die beiden über eine Faser verbundenen Transceiver arbeiten mit unterschiedlichen Spektren (1.311 und 1.331 nm, 8 nm Bandbreite), um gleichzeitig senden zu können (Full Duplex).

Entsprechend existieren zwei Typen von Transceivern – A und B -, wobei jeweils nur verschiedene Typen miteinander verbunden werden können. Jeder 200.Gbit-Kanal – ganz exakt liegt die Rohdatenrate bei 212,5 GBit/s – ist zudem in vier einzelne Datenströme aufgeteilt, die jeweils Licht einer anderen Wellenlänge nutzen.

Als Codierung wird NRZ ( Non-return to Zero(öffnet im neuen Fenster) ) genutzt, der Standard sieht die Kombination von bis zu acht Fasern für maximal 1,6 TBit/s vor. Als Lichtquelle dient ein externer Laser, der mehrere Transceiver versorgen kann. Zusammen mit Co-Packaged Optics – wobei der Transceiver auf dem Interposer, im Package oder auf dem Mainboard platziert werden kann – benötigt dieser Ansatz wesentlich weniger Energie als klassische optische SFP-Module.

Wie die optischen Verbindungen genutzt werden, bleibt abzuwarten. Denkbar ist, dass innerhalb eines Rack-Einschubs vorerst weiter elektrische Verbindungen zur Anbindung an die jeweiligen Switches verwendet werden. Die Switches verschiedener Einschübe könnten dann optisch verbunden werden, was Latenzen reduzieren würde.


Relevante Themen