ARM-Server: Ampere zeigt Prozessor mit 192 Kernen
Der Ampere One nutzt keine ARM-Designs mehr, sondern eigene Kerne. Für den Chip zählt: Mehr ist mehr.

Der für seine Cloudserver-Chips mit ARM-Befehlssatz bekannte Hersteller Ampere hat mit dem Ampere One einen neuen Prozessor vorgestellt, der bis zu 192 Single-Thread-Kerne bieten soll. Mit der Vorgängergeneration bot Ampere im Altra (Test) beim Altra Max eine Höchstzahl von 128 Kernen. Der Hersteller nutzt für den Ampere One außerdem erstmals eine eigene Mikroarchitektur. Zuvor kamen die N1-Neoverse von ARM selbst zum Einsatz. Gefertigt wird der Chip im 5-nm-Verfahren bei TSMC.
Für die Siryn-Kerne hat Ampere laut Semianalysis die Pipeline im Vergleich zum Vorgänger von acht auf zwölf Stufen erhöht, eine fünfte ALU hinzugefügt, zwei weitere AGUs sowie eine neue dedizierte Gleitkommaeinheit, die Gleitkomma- in Ganzzahlen umwandeln kann. Unterstützt werden dabei die für KI-Anwendungen wichtigen Formate FP16, Bfloat16, Int8 und Int16. Auch den Scheduler hat der Hersteller überarbeitet.
Den L1i-Cache hat Ampere laut Datenblatt von 64 KByte auf 16 KByte reduziert. Das ist ungewöhnlich, könnte aber Platz und Kosten sparen. Der L1-Data-Cache bleibt mit 64 KByte so groß wie beim Vorgänger. Der L2-Cache ist von 1 auf 2 MByte vergrößert worden. Der System-Level-Cache oder L3 umfasst 64 Mbyte. Zur Speicheranbindung stehen acht Kanäle für DDR5 bereit, was bis zu 8 TByte RAM ermöglichen soll. Eine Erweiterung auf zwölf Kanäle ist offenbar bereits in Arbeit. Hinzu kommen 128 PCIe-Gen5-Lanes.
Ein Prozessor für Hyperscaler
Mit der massiven Skalierung der Kernanzahl mit Konfigurationen von 136, 144, 160, 172 und 192 Kernen setzt Ampere wie schon beim Vorgänger ganz auf das Cloudgeschäft. In diesen Umgebungen werden eben immer mehr VMs oder Dienste als Microservice gehostet. Die Single-Thread-Nutzung sollte dabei nicht nur vor typischen Seitenkanalangriffen der Art von Meltdown und Spectre schützen. Auf geteilter Infrastruktur mit mehreren Threass kann sich die Leistung einzelner Kerne darüber hinaus aber eben auch stark gegenseitig beeinflussen. Ampere setzt hier auf eine Vorhersagbarkeit der Leistung.
Das Ausreizen des absoluten technischen Maximums, wie etwa Intel und AMD dies bei ihren x86-Chips anbieten, erscheint im Cloudszenario mit vielen Kunden auch nicht zwingend sinnvoll. Der Takt der hauseigenen Siryn-Kerne des Chips ist deshalb gleich und auf maximal 3,0 GHz Takt beschränkt. Hinzu kommt, dass die sowieso schon vergleichsweise energieeffizienten ARM-Kerne im direkten Vergleich im x86-Chip weiter starke Vorteile bei der Leistung pro Watt haben sollten. Auch das ist für Cloudhoster wichtig, die sehr stark skalieren können.
Eine Mesh-Konfiguration soll die Kommunikation zwischen den Kernen und mit I/O-Schnittstellen verbessern. Unterstützt wird zudem die Nested Virtualization, eine sichere Virtualisierung, die Speicherverschlüsselung und das ARM-Memory-Tagging. Letzteres soll das Ausnutzen von Buffer-Overflows verhindern.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Wer als Info im Artikel noch interessant gewesen. VG Alex
Kommentieren