Zum Hauptinhalt Zur Navigation

Granite Rapids: Ein neues IO-Tile macht Intels Xeons zur Edge-CPU

Hot Chips
5G -Basisstationen und Streaming- Rechenzentren sind rechenintensiv. Dank Chiplet-Architektur kann Intel dafür einfach angepasste Granite-Rapids- Xeons anbieten.
/ Johannes Hiltscher
2 Kommentare News folgen (öffnet im neuen Fenster)
Den Xeon 6 bringt Intel als angepasste Version für Edge-Rechenzentren. (Bild: Intel)
Den Xeon 6 bringt Intel als angepasste Version für Edge-Rechenzentren. Bild: Intel

Auf der aktuell stattfindenden Konferenz Hot Chips(öffnet im neuen Fenster) hat Intel über die neue Edge-Linie – erkennbar am D im Namen – der sechsten Xeon-Generation gesprochen. Die werden etwa in 5G-Basisstationen und Edge-Rechenzentren für Videostreaming eingesetzt – was spezielle Anforderungen bedeutet. Bislang bot Intel hier nur Prozessoren der mittlerweile drei Jahre alten Ice-Lake-Generation (g+) an. Der Umstieg auf Xeon 6 alias Granite Rapids bringt ein deutliches Leistungsplus – auch dank spezieller Beschleuniger.

Da Intel mittlerweile auf eine 2023 vorgestellte Chiplet-Architektur umgestiegen ist, sind die Änderungen gegenüber den regulären Xeons gering: Bis zu zwei Dies mit Redwood-Cove-Performance-Kernen werden mit einem speziell für die Edge-Variante entwickelten IO-Die kombiniert. Verbunden sind die einzelnen Chiplets über Intels Embedded Multi-Die Interconnect Bridges (EMIBs).

Anders als bei den regulären Xeons wird das IO-Die im Intel-4-Prozess anstelle von Intel 7 gefertigt. Die Chiplets mit Rechenkernen und jeweils vier DDR5-Speichercontrollern werden mit Intel 3 gefertigt. Für das IO-Die nutzt Intel einen moderneren Prozess, da dieses neben zwei 100-GBit-Ethernet-Schnittstellen spezielle Beschleuniger für die Zielmärkte enthält. Auch CXL 2.0 unterstützt das IO-Die.

Die IO-Bandbreite steigt mit der neuen Xeon-D-Generation deutlich an: Die Ethernet-Bandbreite hat Intel verdoppelt, die Ethernet-Einheiten unterstützen zudem Protocol Offloading ( Data Processing Unit, DPU, g+ ), müssen aber ohne Remote DMA (Direct Memory Access) auskommen. PCIe bietet die zweieinhalbfache Bandbreite. Dank der neuen Fertigung gibt es mehr als die dreifache Kernanzahl, auch die Speicherbandbreite liegt mehr als dreimal so hoch wie beim Vorgänger.

Integrierte Beschleuniger

Die speziellen Zielmärkte erfordern teils hohe Rechenleistung oder sind mit spezieller Hardware effizienter zu realisieren. Daher bringen die Xeon-D-Beschleuniger für die Bearbeitung von Videodaten – konkret (De-)Codierung, Skalierung und Beschnitt – mit.

Ein Load Balancer für Netzwerkpakete ist ebenso im IO-Die integriert wie ein spezieller Block zur Unterstützung von vRAN . Auf den ging Intel nicht näher ein, dafür aber auf die Quick-Assist-Module.

Die können nicht nur mittels Quality-of-Service (QoS) Datenströme priorisieren und somit Echtzeitverhalten ermöglichen. Sie können ein- und ausgehende Daten auch parallel ver- und entschlüsseln sowie komprimieren und dekomprimieren – und alles zusammen. Dabei sind sogar aufwendige Datenflüsse möglich, bei denen Daten zunächst komprimiert und verschlüsselt werden, während diese Operationen anschließend wieder rückgängig gemacht werden, um sicherzustellen, dass die ausgegebenen Daten noch den Eingabedaten entsprechen. Das entlastet die Prozessorkerne von diesen Aufgaben, ist allerdings weniger flexibel: Das Quick-Assist-Modul unterstützt etwa nur die Kompressionsstandards deflate und zlib.

Auch im Edge-Segment gewinnt laut Intel KI eine immer größere Bedeutung, weshalb im Vortrag die neuen Advanced Matrix Extensions (AMX) besonders hervorgehoben wurden. Gegenüber der Vorgängergeneration sollen die neuen Modelle bei Resnet-50, einem Benchmark für Bilderkennung, mehr als die achtfache Leistung erreichen, bei einem nicht näher benannten Transformer-Modell sollen sie mehr als sechsmal so schnell rechnen.

Zwei Packages, ein Sockel

Interessant an den Xeon-D ist, dass Intel sie in zwei Varianten anbietet: Mit einem oder zwei Compute-Chiplets und somit vier oder acht Speicher-Controllern. Die kleine Variante kommt in einem schmaleren Package, da sie mit weniger Kontakten auskommt. Sie passt allerdings in den gleichen Sockel wie die große Variante.

Für besonders beengte Verhältnisse gibt es allerdings auch einen Sockel, in den lediglich die kleine Variante mit einem Compute-Chiplet passt.


Relevante Themen