Neue Ascend & Kunpeng: Huaweis Frontalangriff auf Nvidia und den Westen

Inhalt
Huawei hat im Rahmen seiner Hausmesse Connect neue Hardware für KI-Rechenzentren angekündigt(öffnet im neuen Fenster) . Die von CEO Eric Xu präsentierte Roadmap sieht nicht nur der von Nvidia verdächtig ähnlich, innerhalb von nicht einmal einer Woche hat das Unternehmen auch ein quasi identisches Konzept zu Nvidias CPX-Beschleunigern vorgestellt. Zusätzlich wurde ein Clustercomputer mit über 500.000 eigenen KI-Beschleunigern angekündigt. Aus der Ankündigung lassen sich aber auch Schlüsse ziehen, die weit über Huawei hinausgehen.
So scheint Chinas Halbleiterbranche zwei kritische Meilensteine gemeistert zu haben. Zum einen sollen die für 2026 angekündigten KI-Beschleuniger Ascend 950 erstmals in der Volksrepublik China entwickelten und gefertigten High Bandwidth Memory (HBM) nutzen. Darüber hinaus lässt sich darauf schließen, dass der Auftragsfertiger Smic mittlerweile wohl eine ausreichend hohe Ausbeute (Yield) bei seinem 7-nm-Prozess (N+2) erreicht, um das Land mit KI-Hardware zu versorgen. Die Fertigungskapazität soll zudem deutlich ausgebaut werden.
Selbstverständlich ist eine gewisse Skepsis gegenüber Huaweis Ankündigungen angebracht: In den vergangenen Jahren hielt das Unternehmen seine Zeitpläne nicht ein, musste über Umwege weiter bei TSMC fertigen lassen und wurde von Nutzern für sein im Vergleich zu Cuda schlechteres Software-Ökosystem kritisiert. Hinzu kommt, dass solche Ankündigungen immer auch Teil der staatlichen Propaganda sind. Die möchte das Bild vermitteln: China braucht den Westen nicht.
Die neue Offenheit spricht Bände
Einfach so vom Tisch wischen lässt sich damit aber insbesondere die Ableitung bezüglich Smic nicht. Denn in der Vergangenheit machte Huawei um seine Hardware – neben den Ascend-Beschleunigern die Server-CPU-Reihe Kunpeng – ein großes Geheimnis.
Zudem geht die chinesische Regierung zunehmend restriktiv gegen den Einsatz von Nvidia-Hardware vor. Es muss also eine zumindest ordentlich nutzbare Alternative geben, schließlich ist KI einer der zentralen Schauplätze, auf denen der Konflikt mit den USA ausgetragen wird. Verdeckt bei TSMC fertigen zu lassen, ist für Huawei immer schwieriger geworden, was den Schluss nahelegt, dass Smic hier mittlerweile eine ausreichend gute Alternative ist.
Die Parameter der neu angekündigten Produkte unterscheiden sich auch deutlich von denen der Ascend 910B und 910C (der zwei 910B auf einem Package kombiniert ) sowie dem Kunpeng 930. Entsprechend dürften neu entwickelte Chiplets die Grundlage sein.
Die angekündigten Kunpeng-CPUs sollen etwa deutlich mehr Kerne haben und hier auf dem Niveau von AMD und Intel sein: 2026 soll der Kunpeng 950 in zwei Varianten mit 96 und 192 Kernen und jeweils doppelt so vielen Threads auf den Markt kommen. Ähnlich wie bei Intels Xeon sind für 2028 ein High-Performance- und ein High-Density-Modell mit 96 und 256 Kernen geplant. Dass auch die Rechenleistung konkurrenzfähig sein wird, halten wir aber für fraglich.
Nach einer Woche hat Huawei Nvidia eingeholt
Huaweis Roadmap umfasst die nächsten drei Jahre, in denen jeweils eine neue Ascend-Generation veröffentlicht werden soll. Den Anfang machen 2026 der 950PR und 950DT, wobei Ersterer für die Prefill-Phase von Transformern (Befüllen des KV Cache) und Empfehlungen (Recommendations) ausgelegt ist, Zweiterer für die Decode-Phase (Token-Generierung) und Training. Der 950PR verfügt bei gleicher Rechenleistung über weniger Speicher mit geringerer Bandbreite, da die Prefill-Phase eher rechen- als speicherbandbreitenintensiv ist.
Eben diese Zweiteilung hatte Nvidia erst vergangene Woche mit Rubin CPX angekündigt, was Semianalysis als bahnbrechende Veränderung einschätzt(öffnet im neuen Fenster) . Denn die Möglichkeit, für die verschiedenen Komponenten eines Transformer-Modells angepasste und teils preiswertere Hardware zu nutzen, ermögliche einen günstigeren Betrieb großer Modelle.
Dass Huawei diesen Vorteil innerhalb von nur einer Woche kassiert, ist bemerkenswert. Huawei übernimmt zudem Nvidias Parallelisierungmodell: Bislang waren die Ascends eine SIMD-Architektur (Single Instruction Multiple Data, wie AVX), die 950-Serie kombiniert dies mit SIMT (Single Instruction Multiple Threads), auf das Nvidia setzt. Hier führen mehrere Rechenkerne denselben Befehl aus (g+) .
Bei der Rechenleistung bleibt Huawei allerdings weiter hinter Nvidia.



