Zhenwu 890 & Qwen3.7-Max: Alibaba bringt neuen KI-Beschleuniger und Reasoning-Modell
Bei der Entwicklung eigener KI-Hardware sind Cloudanbieter aus der Volksrepublik China ähnlich aktiv wie die Branchengrößen aus den USA. Alibaba hat im Rahmen seiner Entwicklerkonferenz Aliyun Cloud Summit mit Zhenwu 890 die nächste Hardware-Generation angekündigt(öffnet im neuen Fenster). Für die kommenden zwei Jahre ist mit dem V900 und J900 jeweils ein neues Modell vorgesehen.
Der Chip unterstützt Gleitkommadatentypen von 4 bis 32 Bit (FP4 bis FP32) und soll sich damit sowohl für Training als auch Inferenz eignen. Angaben zur Rechenleistung finden sich nicht; der erst im Januar 2026 offiziell vorgestellte Vorgänger Zhenwu 810E(öffnet im neuen Fenster) wurde allerdings in die Leistungsklasse von Nvidias A800 eingeordnet.
Dessen Leistung soll der Zhenwu 890 verdreifachen. Selbst wenn Alibaba keinen Leistungszuwachs durch einen Wechsel von 8- auf 4-Bit-Datentypen einrechnet, dürfte der neue Beschleuniger noch unter dem Niveau von Nvidias H100 liegen.
Zudem bekommt der Zhenwu 890 mit 144 GByte 50 Prozent mehr High Bandwidth Memory (HBM). Auch beim Speicher fehlt allerdings eine Leistungsangabe, der Vorgänger soll HBM2e nutzen. Direkte Angaben zur Leistungsaufnahme fehlen ebenfalls, beim Vorgänger soll sie 400 W betragen. Das verwendete Rack-System mit Wasserkühlung soll aber bis zu 2 kW pro Beschleuniger abführen können.
Nochmals dreifache Leistung 2027
Laut einer im Rahmen des Aliyun Cloud Summit gezeigten Roadmap(öffnet im neuen Fenster) soll der für das dritte Quartal 2027 geplante V900 Leistung und Speicherkapazität im gleichen Umfang steigern. Hier scheint es sich um eine Weiterentwicklung zu handeln, während der J900 wohl eine neue Architektur nutzen wird.
Die Roadmap datiert zudem den Zhenwu 810E auf das zweite Quartal 2024. Dass der Beschleuniger bereits länger genutzt wird, liegt auch nahe, da Alibaba bis Ende des ersten Quartals 2026 bereits 600.000 Stück ausgeliefert haben will. Server-Systeme sollen dabei Zehntausende Beschleuniger umfassen. Die sollen auch an Kunden wie Xpeng und die State Grid Corporation of China(öffnet im neuen Fenster), den größeren der beiden Stromnetzbetreiber der Volksrepublik, geliefert worden sein. Unter anderem sollen auf Zhenwu-Systemen Modelle für autonomes Fahren laufen.
Eigenes Scale-up-System für 128 Beschleuniger
Ähnlich wie AWS oder Google hat Alibaba auch ein eigenes Verbindungsnetzwerk gleich mit entworfen. Es baut auf einem schlicht ICN 1.0 genannten Chip mit einer Bandbreite von 25,6 TBit/s auf. Damit können aktuell 64 Zhenwu 890(öffnet im neuen Fenster) direkt zu einem Scale-up-System vernetzt werden. Das Scale-up-System bietet allerdings Platz für 128 Beschleuniger, die perspektivisch auch direkt vernetzt werden sollen.
Die Basis dafür ist(öffnet im neuen Fenster) das ebenfalls selbst entworfene Panjiu-AL128-Rack(öffnet im neuen Fenster). Es setzt auf getrennte CPU- und Beschleuniger-Knoten, wobei in letzteren je vier Zhenwu-Chips sitzen. Innerhalb der Scale-up-Domäne gibt Alibaba die Bandbreite von Chip zu Chip mit 800 GBit/s bei einer Latenz von 100 ns an. Beim Zhenwu 810E waren es 700 GBit/s, der V900 soll 1,2 TB/s erreichen. Alibaba nutzt hier Ultra Accelerator Link (Ualink, Präsentation, PDF(öffnet im neuen Fenster)), an dem auch AMD und Intel sowie die US-Hyperscaler AWS, Google, Meta und Microsoft mit entwickeln.
Entwickelt hat die KI-Beschleuniger Alibabas Hardware-Sparte T-Head. Die ist hauptsächlich für die Entwicklung von ARM-CPUs für Alibabas Rechenzentren und entwarf RISC-V-Kerne. Aber auch an einem KI-Inferenz-Beschleuniger arbeitete T-Head bereits früh.
Neue Hardware, neues Modell
Intern nutzt Alibaba die Zhenwu-Beschleuniger für seine Qwen-Modelle. Parallel zur Zhenwu 890 stellte Alibaba hier mit Qwen3.7-Max eine neue Generation vor – die allerdings bislang nur als Preview verfügbar ist. Hier soll das neue Modell aktuell ausschließlich im Reasoning-Modus laufen. Die Relevanz über eigene Modell hinaus zeigt aber auch, dass Zhenwu eine der acht chinesischen Architekturen war, für die Deepseek V4 initial veröffentlicht wurde.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



