Zum Hauptinhalt Zur Navigation

Xuantie C950: Alibaba sieht seine neue RISC-V-CPU auf Zen5-Niveau

Hohe Integer-Leistung, Matrixeinheit für KI-Inferenz, großes Out-of-Order-Fenster: Alibaba scheint einen beeindruckenden RISC-V -Kern entworfen zu haben.
/ Johannes Hiltscher
5 Kommentare News folgen (öffnet im neuen Fenster)
Um die Fertigung von Alibabas RISC-V-CPUs kümmert sich die Tochter T-Head. (Bild: T-Head)
Um die Fertigung von Alibabas RISC-V-CPUs kümmert sich die Tochter T-Head. Bild: T-Head

Alibaba setzt für seine Clouddienste in der Volksrepublik China seit Jahren auf selbst entwickelte RISC-V-Prozessoren. Im Rahmen der Xuantie-RISC-V-Ökosystem-Konferenz 2026 hat Damo Academy, das die Kerne entwickelt, den Xuantie C950(öffnet im neuen Fenster) vorgestellt. Er ergänzt den vor rund einem Jahr vorgestellten C930 und verspricht eine deutliche Leistungssteigerung. Verbaut werden sollen CPUs mit C950-Kernen in High-End-Servern.

Chinesische Medien berichteten(öffnet im neuen Fenster) , dass ein C950-Kern im veralteten Benchmark Specint 2006 auf 70 Punkte kommt – beim Vorgänger waren es rund 37,5. Möglich macht das zum einen ein höherer Takt – die C950-Kerne sollen mit bis zu 3,2 GHz takten, beim Vorgänger waren es 2,5 GHz. Zum anderen hat Damo offensichtlich die Mikroarchitektur deutlich überarbeitet. Laut Datenblatt (PDF) kann der C950 pro Takt acht Befehle decodieren (8-wide), beim Vorgänger waren es nur sechs.

Damit ist der RISC-V-Kern zumindest beim Frontend auf dem Niveau von AMDs Zen5 (g+) , zu dem sich ein direkter Vergleich ziehen lässt: Für Specint 2017 werden beim C950 8,3 Punkte angegeben, bei deutlich niedrigerem Takt sind das rund 70 Prozent der Leistung eines Ryzen 9 9950X(öffnet im neuen Fenster) . Bei gleicher Taktfrequenz dürfte der C950 zumindest bei der Integer-Leistung vor AMDs Zen5 liegen.

Erwähnt werden muss allerdings, dass zum C950 keine unabhängigen Benchmarks vorliegen. Eine gewisse Skepsis ist daher angebracht. Dennoch scheint Damo Academy den aktuell wohl leistungsfähigsten RISC-V-Kern entwickelt zu haben.

Mehr Ressourcen dank besserer Fertigung

Zum Anspruch einer High-End-Server-CPU passt das große Out-of-Order-Fenster (g+) , über 1.000 Befehle soll die CPU umsortieren können. Auch bei der Vektoreinheit wird wohl nicht gespart, so sind zwei 256-Bit-Einheiten verbaut. Laut Datenblatt unterstützen beide Version 1.0 der RISC-V-Vector Extension vollständig. Auch kryptografische Berechnungen werden unterstützt.

Zusätzlich ist noch eine Matrixeinheit integriert, die für KI-Inferenz ausgelegt ist. Sie entspricht Version 0.5 der Attached Matrix Extension (AME)(öffnet im neuen Fenster) , die von einer RISC-V-Arbeitsgruppe entworfen wird. Angegeben wird eine Rechenleistung von bis zu 8 TOPS; unterstützt werden die im KI-Bereich gängigen 16-, 8- und 4-Bit-Integer- und Gleitkommadatentypen.

Möglich macht die umfangreiche Ausstattung, dass Alibaba für die Fertigung den Berichten zufolge auf einen 5-nm-Prozess setzt. Damit dürfte SMICs N+3-Prozess gemeint sein, der einer Analyse von Techinsights zufolge etwa auf dem Niveau von TSMCs 6-nm-Prozess ist. Die Pipeline ( Hintergrund, g+ ) bleibt 16-stufig, vermutlich bezieht sich die Angabe auf die Integer-Pipeline. Der Kern entspricht dem RVA23-Profil.

Konfigurierbar und skalierbar

Wie bei den Xuantie-Kernen üblich, ist auch der C950 ein konfigurierbares Design. Anpassen lassen sich die Größe des L2-Cache – maximal sind 3 MByte pro Kern möglich. Auch Konfigurationen ohne Matrix- und Vektoreinheit sind möglich. Über das Multi-Cluster-Verbindungsnetzwerk XL-300 können, wie beim Vorgänger XL-200, acht Kerne zu einem Cluster gruppiert werden. Dem stehen bis zu 8 MByte L3-Cache zur Verfügung.

In zweiter Instanz scheinen weiterhin vier Cluster kombiniert werden zu können, maximal wären dann 32 Kerne pro Chip möglich. Zum XL-300 fehlen allerdings aktuell noch Daten auf der Xuantie-Homepage. Welche Konfiguration Alibaba in seinen Rechenzentren einsetzt, ist noch nicht bekannt.

Neben dem C950 wurde auch noch der C925 für Edge-Anwendungen vorgestellt. Er ist vom C930 abgeleitet und soll trotz 11 Prozent höherer Leistung fast ein Drittel kleiner sein als der C930. Alle drei Kerne sieht Alibaba als eine Familie; sie sollen in verschiedenen Anwendungsfällen zum Einsatz kommen.


Relevante Themen