Suche

Architekturverbesserungen noch nicht eingerechnet

Anzeige

Die Chips beziehungsweise Chiplets können per Die-to-Die-Interconnect miteinander verbunden werden, um größere Prozessoren zu ermöglichen, auf dem gleichen Weg können auch Rechenbeschleuniger und GPUs angebunden werden. Die zugrundeliegende Plattform, CMN-S3, erlaubt bis zu 256 Kerne pro Die und 512 Kerne pro Sockel. Limitiert wird dies aber durch praktische Beschränkungen wie die maximale Die-Größe bei der Herstellung.

Arm zeigt einige Benchmarks zur Performance der neuen Chips, die besonders beim auf Effizienz optimierten N3 stark ansteigt. Verantwortlich dafür ist unter anderem der größere L2-Cache von 2 MByte pro Kern für CSS-N3 sowie 3 MByte pro Kern für CSS-V3 gepaart mit einer verbesserten Sprungvorhersage. Alle Grafiken beziehen sich auf die Leistung der Architektur, Verbesserungen durch neue Fertigungstechniken kommen also noch dazu.

Co-Optimierung nimmt Kunden Arbeit ab

Damit das möglichst reibungslos möglich ist, arbeitet Arm bereits in der Designphase mit Partnern wie Intel, TSMC und Samsung zusammen. So haben Intel und Arm erst gestern die Produktion von 64-Kern-CPUs im Intel 18A-Node angekündigt, vermutlich handelt es sich dabei um CSS-N3. Gemeinsam mit Samsung arbeitet Arm außerdem an der Co-Optimierung von Cortex-Kernen für Samsungs 2-nm GAA-Node.

Anzeige

Damit kann Arm nicht nur die Basis für Custom-Chips liefern, sondern bietet seinen Kunden im Anschluss auch ein bereits für diese Architektur optimiertes Fertigungsverfahren in einem Leading-Edge-Node. Das bedeutet im besten Fall mehr Performance und Effizienz, vor allem aber weniger Entwicklungszeit bis zum Produktionsstart.

Chiplets können beliebig kombiniert werden

Arm sorgt mit der Chiplet-System-Architecture dafür, dass einzelne Chiplets in einem heterogenen Aufbau mit anderen Chiplets kombiniert werden können, um fast beliebige Prozessoren und Beschleuniger zu bauen. Dazu wird UCIe (Universal Chiplet Interconnect) verwendet, was bisher aber nur von Nvidia im GH100 und GH200 genutzt wird.

CSS-N3 steht ganz im Zeichen der Energieeffizienz, lässt sich aber um weitere Dies erweitern.(Quelle: Arm via Tomshardware) [1/8]

Verbesserte Sprungsvorhersage und mehr Cache sorgen für zusätzliche Performance, die beim N3 aber vor allem für mehr Effizienz genutzt wird. (Quelle: Arm via Tomshardware) [2/8]

Die Verbesserungen in einigen Anwendungsbereichen durchaus signifikant. (Quelle: Arm via Tomshardware) [3/8]

Beim CSS-V3 ist Performance das Hauptziel, wobei Arm in allen Bereichen auf Effizienz achtet. (Quelle: Arm via Tomshardware) [4/8]

Neben noch mehr Cache gibt es breitere Speicheranbindung und zwei Interconnects für Chiplet-Cluster. (Quelle: Arm via Tomshardware) [5/8]

Auch der V3 bietet mehr Leistung im Vergleich zum direkten Vorgänger. (Quelle: Arm via Tomshardware) [6/8]

Neben CPU-Kernen selbst ist die gesamte Plattform für Kunden wichtig, da sie die Integration aller Elemente ermöglicht. (Quelle: Arm via Tomshardware) [7/8]

Neoverse CSS 3 ist fertig, die Entwicklung am Nachfolger hat bereits begonnen. (Quelle: Arm via Tomshardware) [8/8]

Auf Arms Roadmap ist bereits die Nachfolgegeneration zu sehen, die sich aktuell in Entwicklung befinden soll. Ein Datum nennt der Chipentwickler allerdings noch nicht, die vergangenen Generationen folgten aber fast im Jahrestakt. In Anbetracht des massiven Bedarfs nach mehr und gleichzeitig effizienterer Rechenleistung dürfte Arm sich mit der Weiterentwicklung nicht unnötig viel Zeit lassen.

  1. 1
  2. 2