Architekturverbesserungen noch nicht eingerechnet
Die Chips beziehungsweise Chiplets können per Die-to-Die-Interconnect miteinander verbunden werden, um größere Prozessoren zu ermöglichen, auf dem gleichen Weg können auch Rechenbeschleuniger und GPUs angebunden werden. Die zugrundeliegende Plattform, CMN-S3, erlaubt bis zu 256 Kerne pro Die und 512 Kerne pro Sockel. Limitiert wird dies aber durch praktische Beschränkungen wie die maximale Die-Größe bei der Herstellung.
Arm zeigt einige Benchmarks zur Performance der neuen Chips, die besonders beim auf Effizienz optimierten N3 stark ansteigt. Verantwortlich dafür ist unter anderem der größere L2-Cache von 2 MByte pro Kern für CSS-N3 sowie 3 MByte pro Kern für CSS-V3 gepaart mit einer verbesserten Sprungvorhersage. Alle Grafiken beziehen sich auf die Leistung der Architektur, Verbesserungen durch neue Fertigungstechniken kommen also noch dazu.
Co-Optimierung nimmt Kunden Arbeit ab
Damit das möglichst reibungslos möglich ist, arbeitet Arm bereits in der Designphase mit Partnern wie Intel, TSMC und Samsung zusammen. So haben Intel und Arm erst gestern die Produktion von 64-Kern-CPUs im Intel 18A-Node angekündigt, vermutlich handelt es sich dabei um CSS-N3. Gemeinsam mit Samsung arbeitet Arm außerdem an der Co-Optimierung von Cortex-Kernen für Samsungs 2-nm GAA-Node.
Damit kann Arm nicht nur die Basis für Custom-Chips liefern, sondern bietet seinen Kunden im Anschluss auch ein bereits für diese Architektur optimiertes Fertigungsverfahren in einem Leading-Edge-Node. Das bedeutet im besten Fall mehr Performance und Effizienz, vor allem aber weniger Entwicklungszeit bis zum Produktionsstart.
Chiplets können beliebig kombiniert werden
Arm sorgt mit der Chiplet-System-Architecture dafür, dass einzelne Chiplets in einem heterogenen Aufbau mit anderen Chiplets kombiniert werden können, um fast beliebige Prozessoren und Beschleuniger zu bauen. Dazu wird UCIe (Universal Chiplet Interconnect) verwendet, was bisher aber nur von Nvidia im GH100 und GH200 genutzt wird.
Auf Arms Roadmap ist bereits die Nachfolgegeneration zu sehen, die sich aktuell in Entwicklung befinden soll. Ein Datum nennt der Chipentwickler allerdings noch nicht, die vergangenen Generationen folgten aber fast im Jahrestakt. In Anbetracht des massiven Bedarfs nach mehr und gleichzeitig effizienterer Rechenleistung dürfte Arm sich mit der Weiterentwicklung nicht unnötig viel Zeit lassen.