M1 Ultra: Apples geheimes Doppel-Design
Eine verborgene Verbindung verknüpft zwei Apple-Silicon-Chips: Der M1 Ultra soll sich mit der derzeit schnellsten Desktop-Hardware anlegen.

Ich sehe was, was du nicht siehst: Schon als Apple den M1 Max (Test) vorgestellt hat, gab es Vermutungen, dass der gezeigte Die-Shot nicht korrekt war. Mittlerweile ist auch klar warum, denn Apple hat bewusst den vorhandenen Interconnect des Chips abgeschnitten, der dazu gedacht ist, aus zwei M1 Max den M1 Ultra zu bilden.
Apple wirbt damit, dass der durch die sogenannte Ultra Fusion entstandene Prozessor die Leistung eines Core i9-12900K und einer Geforce RTX 3090 erreicht, dabei aber aufaddiert 300 Watt weniger benötigt. Tatsächlich ist Apple den vorliegenden Informationen nach etwas gelungen, was andere CPU/GPU-Hersteller bisher noch nicht erreicht respektive zumindest noch nicht öffentlich angekündigt haben.
Der M1 Max samt seinem Die-to-Die-Interconnect wird von TSMCs im N5-Verfahren (5 nm EUV) produziert, wobei es ein spezielles 2.5D-Packaging braucht, um beide Chips zu verknüpfen: Laut Apple wird ein Silizium-Interposer verwendet, wobei TSMC mit CoWoS-L (Chip on Wafer on Substrate samt Local Silicon Interconnect) und InFO-L (Integrated Fan-Out samt LSI) zwei denkbare Optionen anbietet.
Ultra Fusion macht Dual-SoC-GPU monolithisch
Mit einer Datenrate von 2,5 TByte/s zwischen den zwei M1-Max-Dies soll der M1 Ultra um mehr als das Vierfache vor anderen Lösungen liegen; AMD gibt für das Infinity Fabric der beiden GPUs eines Instinct-MI250X-Supercomputer-Beschleunigers rund 400 GByte/s an und Intels kommende Xeon-CPUs namens Sapphire Rapids schaffen 500 GByte/s von Chip zu Chip. Vor allem jedoch ist der M1 Ultra der erste Grafikprozessor, der zwar aus zwei Dies besteht - von der Software aber wie ein monolithischer Chip angesprochen wird.
M1 | M1 Pro | M1 Max | M1 Ultra | |
---|---|---|---|---|
Fertigung | 5 nm TSMC | 5 nm TSMC | 5 nm TSMC | 5 nm TSMC |
Transistoren | 16 Mrd | 33,7 Mrd | 57 Mrd | 114 Mrd |
Die-Size | ca 120 mm² | ca 245 mm² * | ca 475 mm² * | ca 950 mm² * |
CPU-Kerne | 4P + 4E | 8P + 2E | 8P + 2E | 16P + 4E |
L2-Caches | 12MB + 4MB | 24MB + 4MB | 24MB + 4MB | 48MB + 8MB |
SL-Cache | 16MB | 24MB | 48MB | 96MB |
GPU-Kerne | 8 @ 2,6 Teraflops | 16 @ 5,2 Teraflops | 32 @ 10,4 Teraflops | 64 @ 20,9 Teraflops |
NPU-Kerne | 16 @ 11 Teraops | 16 @ 11 Teraops | 16 @ 11 Teraops | 32 @ 22 Teraops |
Interface | 128 Bit | 256 Bit | 512 Bit | 1024 Bit |
Bandbreite | 68 GByte/s | 205 GByte/s | 410 GByte/s | 820 GByte/s |
Speicher | LPDDR4X-4266 | LPDDR5-6400 | LPDDR5-6400 | LPDDR5-6400 |
Kapazität | 16 GByte (2x8) | 32 GByte (2x16) | 64 GByte (4x16) | 128 GByte (8x16) |
Power** | bis zu 20 Watt | (?) | bis zu 90 Watt | bis zu 140 Watt |
Weil es sich beim M1 Ultra um einen verdoppelten M1 Max handelt, gibt es 16 Firestorm-Performance- und vier Icestorm-Efficiency-Kerne sowie 64 Grafik- und eine Neural Engine mit 32 Cores. Die Leistung soll dank des Ultra-Fusion-Interconnects nahezu linear steigen, was erste Werte im Geekbench bestätigen. Apple zufolge ist der M1 Ultra bei rund 60 Watt gleich 90 Prozent schneller als ein Core i9-12900K mit DDR5 bei gleicher Verlustleistung, oder anders ausgedrückt: Er schafft die gleiche Performance bei 100 Watt weniger. Die integrierte Grafik des M1 Ultra wiederum soll so schnell wie eine Geforce RTX 3090, dabei jedoch 200 Watt sparsamer sein.
Laut Apple wurden für die Messungen erneut "ausgewählte, branchenübliche Standard-Benchmarks" verwendet, welche der Hersteller aber wie üblich nicht namentlich nennt. Schon beim M1 Max waren die beworbenen Werte nachstellbar, was die CPU/GPU-Leistung des Chips anbelangt hat. Der M1 Ultra im neuen Mac Studio dürfte daher die von Apple beworbene Performance und Effizienz erreichen, wobei das System samt Vollausbau-SoC und 64 GByte Unified-Memory mindestens 5.750 Euro kostet.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Die Probleme in der Fertigung sind sicher immens, bei 400, 500 mm² großen ICs ist die...
Dann muss man halt einfach mal ordentlich vergleichen ein 12900K und nicht Produkte...
Der MacPro wird eine komplette Tischplatte aus ARM Bausteinen haben, dafür braucht der...
Das ist wohl klar. Aber da geht bei der Performance beim Threadripper/Epic halt auch...