Zum Hauptinhalt Zur Navigation

Besser als Xeons?: Loongsons neue Server-CPUs sollen Kernkraftwerke steuern

Der Prozessorentwickler Loongson hat seine 3C6000- Server - CPUs vorgestellt. Beim Leistungsvergleich scheint allerdings geschummelt worden zu sein.
/ Johannes Hiltscher
6 Kommentare News folgen (öffnet im neuen Fenster)
Je nach Chiplet-Anzahl nutzt Loongson ein anderes Package. Nur der 3C6000/D ist gesockelt, die anderen werden verlötet. (Bild: Loongson)
Je nach Chiplet-Anzahl nutzt Loongson ein anderes Package. Nur der 3C6000/D ist gesockelt, die anderen werden verlötet. Bild: Loongson

Angekündigt waren die Loongson-Prozessoren der Serie 3C6000 bereits länger. Bei einer mehrstündigen Veranstaltung (eine Aufzeichnung findet sich beim Videoportal Bilibili(öffnet im neuen Fenster) ) wurden sie nun offiziell vorgestellt. Die drei Varianten mit 16 bis 64 LA664-Kernen sieht Loongson auf dem Niveau von Intels dritter Xeon-Generation (Ice Lake). Bei der Veranstaltung wurden Ergebnisse des Benchmarks SPEC 2017 gezeigt, die das belegen sollen – dazu aber später mehr.

Die Basis der drei Prozessorvarianten ist ein Chiplet mit 16 Rechenkernen, die mittels Simultaneous Multithreading (SMT) jeweils zwei Threads abarbeiten können. Dazu kommen vier DDR4-3200-Speichercontroller sowie 32 MByte L3-Cache. Maximal sind acht Speicherkanäle und 128 PCIe-4-Lanes nutzbar(öffnet im neuen Fenster) .

Zusätzlich ist ein weiterer isolierter LA264-Kern vorhanden. Der ist, ähnlich wie bei AMD-CPUs, für einen abgesicherten Systemstart zuständig und dient als Beschleuniger für die chinesischen Verschlüsselungsstandards SM2/3/4. Je nach Modell takten die Prozessoren mit 2 bis 2,2 GHz. Die Leistungsaufnahme soll bei 120, 200 und 300 Watt liegen.

Bis zu acht Chiplets pro Mainboard

Je nach Variante umfasst eine 3C6000-CPU eines, zwei oder vier Chiplets und kommt damit auf bis zu 64 Kerne. Verbunden sind die Chiplets über ein selbst entwickeltes, kohärentes Interconnect, das Loongson Coherent Link (LCL) oder schlicht Dragonchain genannt wird. Es basiert auf PCIe 4 und unterstützt eine nicht genauer benannte Datenkompression.

Das Namensschema der Prozessoren hat Loongson leicht geändert: Statt 3C/D/E6000 heißen sie nun 3C6000/S, 3C6000/D und 3C6000/Q – der Buchstabe am Ende gibt die Anzahl der Chiplets an und steht für Single, Double oder Quad. Die verschiedenen Varianten kommen in unterschiedlich großen Packages und benötigen daher je ein eigenes Mainboard. Es werden Ein- und Zweisockelsysteme angeboten, von der Variante mit zwei Chiplets finden bis zu vier auf einem Mainboard Platz.

Intels CPUs ausgebremst?

Die gezeigten Benchmark-Ergebnisse sehen die Loongson-Prozessoren bei der Integerleistung souverän vor, bei der Gleitkommaleistung nur knapp hinter den Intel-CPUs. Die Vergleichswerte müssen allerdings in Zweifel gezogen werden: In der Datenbank der Standard Performance Evaluation Corporation (SPEC), die den gleichnamigen Benchmark entwickelt, finden sich deutlich höhere Werte. In den gezeigten Grafiken kommt der Xeon Platinum 8380 ( Test ) bei SPEC int rate und fp rate auf Werte von 333 und 323, in der SPEC-Datenbank finden wir Werte deutlich über 500 und 400, ( beispielhaft(öffnet im neuen Fenster) bei Dell Poweredge C6520).

Noch eklatanter sind die Unterschiede bei den für den Xeon Silver 4314 genannten Werten. In der SPEC-Datenbank kommen die Dual-CPU-Systeme auf doppelt so hohe Werte wie die von Loongson genannten. Einziger erkennbarer Unterschied ist, dass für die Ergebnisse in der SPEC-Datenbank Intels Oneapi-Compiler verwendet wurde, Loongson hingegen den GCC in nicht näher benannter Version nutzte. Den Benchmark verteilt SPEC als Quellcode, der selbst kompiliert wird.

Wichtiger als die exakte Einordnung der Leistung ist aber, dass ein chinesisches Unternehmen erstmals Serverprozessoren mit vielen Kernen anbietet. Die sollen in diversen Bereichen zum Einsatz kommen – auch sicherheitskritischen.

Einsatz in sicherheitskritischen Bereichen

Bei den Serversystemen setzt Loongson nach eigenen Angaben bei allen zentralen Komponenten auf chinesische Zulieferer. Das soll ein hohes Sicherheitsniveau bringen, was wohl auch eine im Rahmen der Vorstellung unterzeichnete Kooperationsvereinbarung ( Videomitschnitt(öffnet im neuen Fenster) ) unterstreichen soll: Loongson-CPUs sollen künftig für die Steuerung von Kraftwerken mit Hualong-One-Reaktor(öffnet im neuen Fenster) genutzt werden.

Auch Banken und Telekommunikationsunternehmen steigen den Vorträgen zufolge auf Loongson-CPUs um. Verwaltung, staatliche Betriebe und Parteiorganisationen müssen seit 2024 CPUs aus der Volksrepublik einsetzen .

Architektonische Neuerungen gibt es bei den 3C6000 nicht: Die LA664-Architektur ist dieselbe wie im von uns getesteten Loongson 3A6000 . Mit der LA864 steht bereits eine Weiterentwicklung in den Startlöchern, damit ist zuerst der Desktopprozessor 3B6600 geplant . Er soll die Kernanzahl auf acht verdoppeln und acht statt bislang sechs Befehle pro Takt decodieren können.

Zweite Baustelle: Eigene GPUs

Daneben wurde eine 9A3000 genannte GPU auf Basis einer neuen LG300-Architektur angekündigt – sie soll 2027, ebenfalls als Chiplet-Design, auf den Markt kommen. Loongsons ebenfalls im Rahmen der Präsentation gezeigte GPU-Architektur erinnert stark an die von Nvidia. Sie basiert auf Stream-Prozessoren, die 16 Gleitkommarecheneinheiten mit einfacher sowie eine mit doppelter Genauigkeit und eine Tensoreinheit kombinieren. Während die Gleitkommaeinheiten zwei Berechnungen pro Takt schaffen, erledigt die Tensoreinheit 512 BF16-Berechnungen. Von diesen Stream-Prozessoren soll die 9A1000-Einheit des 3B6600 acht enthalten, die als dedizierte GPU geplante 9A2000 32.

Die Ähnlichkeit zu Nvidia könnte dabei Prinzip haben: Laut einer Präsentation zu den eigenen Grafikeinheiten strebt Loongson auch eine Kompatibilität zu Nvidias Cuda-Programmierumgebung an.


Relevante Themen