Mit AMD, Nvidia, Broadcom: OCI-MSA definiert interoperables optisches Scale-up
Noch erfolgt die Direktverbindung von KI-Chips im sogenannten Scale-up-Netzwerk elektrisch. Aktuell ist das die ökonomischere Lösung, doch mit immer weiter steigenden Bandbreitenanforderungen und größeren Scale-up-Dimensionen kommen elektrische Verbindungen an ihre Grenzen. Zudem werden optische Verbindungen dank Co-Packaged Optics energieeffizienter – ein Problem der klassischen SFP-Module.
Um nicht jeweils das Rad selbst zu erfinden, fanden sich eine Reihe von Herstellern im Optical Compute Interconnect Multi-Source Agreement(öffnet im neuen Fenster) (OCI-MSA) zusammen. Das Konsortium stellte eine erste Spezifikation für einen optischen Phy mit 200 GBit vor. Die Vereinheitlichung ermöglicht es den Mitgliedern, die gleichen Co-Packaged-Optics-Module zu verwenden. Das spart Entwicklungskosten. Zu den Gründungsmitgliedern zählen neben AMD, Broadcom und Nvidia noch Meta, Microsoft und OpenAI.
Der Standard ordnet sich auf Ebene 1 des OSI-Modells ein. Neben physikalischen Parametern wie Wellenlänge oder erlaubten Verlusten werden Mechanismen für Initialisierung und Diagnose definiert. Dazu gehören Testmuster für das Deskewing (Entzerren, Ausgleichen von Laufzeitunterschieden einzelner Kanäle), Mechanismen zur Initialisierung sowie Statusregister.
Die höheren Protokollebenen können die Mitglieder des Konsortiums frei definieren, Nvidia etwa kann also weiter Nvlink nutzen. Damit erstreckt sich die Interoperabilität rein auf die unterste Ebene des Netzwerk-Stacks.
Bidirektionale Fasern und Faserbündel
Der Standard nutzt Wavelength Division Multiplexing (WDM), um möglichst hohe Datenraten pro Lichtleiter zu erreichen: Die beiden über eine Faser verbundenen Transceiver arbeiten mit unterschiedlichen Spektren (1.311 und 1.331 nm, 8 nm Bandbreite), um gleichzeitig senden zu können (Full Duplex).
Entsprechend existieren zwei Typen von Transceivern – A und B -, wobei jeweils nur verschiedene Typen miteinander verbunden werden können. Jeder 200.Gbit-Kanal – ganz exakt liegt die Rohdatenrate bei 212,5 GBit/s – ist zudem in vier einzelne Datenströme aufgeteilt, die jeweils Licht einer anderen Wellenlänge nutzen.
Als Codierung wird NRZ ( Non-return to Zero(öffnet im neuen Fenster) ) genutzt, der Standard sieht die Kombination von bis zu acht Fasern für maximal 1,6 TBit/s vor. Als Lichtquelle dient ein externer Laser, der mehrere Transceiver versorgen kann. Zusammen mit Co-Packaged Optics – wobei der Transceiver auf dem Interposer, im Package oder auf dem Mainboard platziert werden kann – benötigt dieser Ansatz wesentlich weniger Energie als klassische optische SFP-Module.
Wie die optischen Verbindungen genutzt werden, bleibt abzuwarten. Denkbar ist, dass innerhalb eines Rack-Einschubs vorerst weiter elektrische Verbindungen zur Anbindung an die jeweiligen Switches verwendet werden. Die Switches verschiedener Einschübe könnten dann optisch verbunden werden, was Latenzen reduzieren würde.
- Anzeige Hier geht es zum Meta Quest 3 mit Asgarth's Wrath 2 bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.