Zum Hauptinhalt Zur Navigation Zur Suche

M1 Ultra im Test: Die Krönung des Apple Silicon

Was haben ein Core i9-12900K und eine Geforce RTX 3080 Ti gemein? Beide sind langsamer oder zumindest viel ineffizienter als Apples M1 Ultra.
/ Marc Sauter
273 Kommentare News folgen (öffnet im neuen Fenster)
Apples M1 Ultra im Test (Bild: Apple, Pixabay)
Apples M1 Ultra im Test Bild: Apple, Pixabay

Vor nicht ganz zwei Jahren erst hatte Apple angekündigt, alle Mac-Systeme von x86-Intel-CPUs und AMD-Grafikkarten auf eigenes Apple Silicon umzustellen. Mit dem neuen Mac Studio gibt es die bisher leistungsstärkste Ausbaustufe: Der M1 Ultra genannte Chip soll Apple zufolge die derzeit schnellste Desktop-Hardware einholen und dabei auch noch sparsamer sein. Und ja, da hat gerade jemand laut "amazing" gedacht!

Tatsächlich hat Apple nicht zu viel versprochen, denn der M1 Ultra ist dank seines cleveren Designs ein extrem schneller sowie effizienter Prozessor geworden und das, obwohl die eigentliche Technik mittlerweile weit über zwei Jahre alt ist. Das zeigt umso mehr, wie konkurrenzlos Apples ARM-Chips sind. Warum, beleuchten wir mit einer ausführlichen Analyse, gefolgt von Benchmarks gegen den Core i9-12900K, den Ryzen 9 5950X und die Geforce RTX 3080 Ti.

Der M1 Ultra basiert auf dem M1 Max (Test), welcher wiederum eine erweiterte Version des regulären M1 (Test) darstellt. Sie alle haben gemein, dass zumindest die CPU-, GPU- und NPU-Kerne vom A14 abstammen, der im Herbst 2020 zusammen mit dem iPad Air und dem iPhone 12 (Mini) veröffentlicht wurde. Für die einzelnen Ausbaustufen vom A14 über M1 bis zum M1 Pro/Max hat Apple die Menge der Funktionseinheiten durch anteilige Verdopplung nach oben skaliert, der M1 Ultra verdoppelt sie erneut.

Apples Potara(öffnet im neuen Fenster)-Ohrringe heißen Ultra Fusion

Gehen wir aber zuerst einen Schritt zurück: Alle M1-Prozessoren sind monolithische Chips, die neben Performance-Cores (Firestorm) und Efficiency-Cores (Icestorm), einer Grafikeinheit, einer Neural Engine (ANE aka NPU), einem SSD- sowie einem LPDDR4X/LPDDR5-Controller auch Decoder/Encoder und Interfaces für etwa Thunderbolt 4 aufweisen. Die größte Ausbaustufe war bisher der M1 Max, dessen Design sich zusammengefasst als 8P+2E+16N+32G bezeichnen lässt.

Spezifikationen des M1 Apple Silicon * basierend auf Apples (verzerrten) Die-Shots ** gemessen
M1M1 ProM1 MaxM1 Ultra
Fertigung5 nm TSMC 5 nm TSMC 5 nm TSMC 5 nm TSMC
Transistoren16 Mrd33,7 Mrd57 Mrd114 Mrd
Die-Sizeca 120 mm²ca 245 mm² *ca 475 mm² *ca 950 mm² *
CPU-Kerne4P + 4E 8P + 2E8P + 2E16P + 4E
L2-Caches12MB + 4MB24MB + 4MB24MB + 4MB48MB + 8MB
SL-Cache16MB24MB48MB96MB
GPU-Kerne8 @ 2,6 Teraflops16 @ 5,2 Teraflops32 @ 10,4 Teraflops64 @ 20,9 Teraflops
NPU-Kerne16 @ 11 Teraops16 @ 11 Teraops16 @ 11 Teraops32 @ 22 Teraops
Interface128 Bit256 Bit512 Bit1024 Bit
Bandbreite68 GByte/s205 GByte/s410 GByte/s820 GByte/s
SpeicherLPDDR4X-4266LPDDR5-6400LPDDR5-6400LPDDR5-6400
Kapazität16 GByte (2x8)32 GByte (2x16)64 GByte (4x16)128 GByte (8x16)
Power**bis zu 20 Watt(?)bis zu 90 Wattbis zu 140 Watt

Dieses zu verdoppeln, würde einen enorm großen Chip erfordern, der sich nahe der Grenze des Machbaren bewegt oder gar darüber hinaus geht – das Limit für die Maske (Reticle) eines Steppers liegt bei 858 mm². Ergo hat sich Apple dafür entschieden, zwei M1-Max-Dies zu verknüpfen, indem diese auf einen gemeinsamen Träger gesetzt werden. Offiziell ist von einem Silizium-Interposer die Rede, welcher die Ultra Fusion möglich macht. TSMC als Fertigungspartner bietet zwei Optionen an, CoWoS-L(öffnet im neuen Fenster) (Chip on Wafer on Substrate samt LSI) und InFO-L(öffnet im neuen Fenster) (Integrated Fan-Out samt LSI), genutzt laut TSMC(öffnet im neuen Fenster) allerdings Letztere.

Apple stellt den M1 Ultra vor
Apple stellt den M1 Ultra vor (05:32)

Anzeige

Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.

Wichtig ist hier der LSI (Local Silicon Interconnect), welcher kleine Brücken zwischen den einzelnen Dies bildet und diese mit äußerst hoher Geschwindigkeit verbindet – Apple gibt 2,5 TByte/s an. Basierend auf einem Hintergrundgespräch mit Apple und unserem Verständnis nach handelt es sich nicht um eine InFO-L-Standardlösung, sondern um eine modifizierte, da Apple laut eigener Aussage über ein exzellentes Inhouse-Packaging-Team verfügt. Vor allem ist der M1 Ultra der erste Grafikprozessor, der zwar aus zwei Dies besteht – von der Software aber wie ein monolithischer Chip angesprochen wird.

Schauen wir uns an, wie sich der M1 Ultra gegen x86-Hardware sowie schnelle Desktop-Grafikkarten schlägt und wie die Effizienz ausfällt.

Beeindruckend schnell, beeindruckend effizient

Apple selbst gibt an, dass der M1 Ultra bei rund 60 Watt eine um 90 Prozent höhere CPU-Geschwindigkeit aufweist als ein 16-kerniger Core i9-12900K bei identischer Leistungsaufnahme und dass die integrierte Grafik so flott ist wie Nvidias Topmodell – die Geforce RTX 3090 -, dabei aber satte 200 Watt weniger benötigt.

Bevor wir uns der Konkurrenz zuwenden, werfen wir zuerst einen Blick auf Apples eigenes Portfolio: Verglichen mit dem M1 Max weist der M1 Ultra zwar durch die Bank die doppelten Ressourcen auf, das alleine garantiert aufgrund des Multi-Chip-Aufbaus jedoch nicht zwingend eine entsprechend höhere Performance. So sehen wir in diversen CPU/GPU-Benchmarks, dass der M1 Ultra nicht die doppelte Leistung erreicht und das, obwohl er laut Apples Powermetrics oft doppelt so viel Energie aufnimmt.

So skalieren 7-Zip (Dekompression), Adobe Premiere (4K Heavy GPU Effects & CPU-Transcoding von 8K RED), Blender (CPU) und der Cinebench R23 zwar linear. Das Komprimieren per 7-Zip sowie der Geekbench hingegen fallen ab, die 4K Heavy CPU Effects in Adobe Premiere laufen nur noch 40 Prozent schneller. Auffällig sind die auf 60 bis 70 Prozent begrenzten Zuwächse im 3DMark, in Blender (Metal) und im GFXBench – angesichts von 100 Watt Package Power scheint die GPU gehemmt zu sein.

Die Konkurrenz hat das Nachsehen

Auf uns wirkt es so, als ob Apple den M1 Ultra bewusst nicht voll ausreizt – bei Doppellast auf CPU und GPU sehen wir Spitzen von leicht über 140 Watt, der M1 Max mit halb so vielen Kernen hatte mit 90 Watt hier klar mehr Energie pro Funktionseinheit und damit einen höheren Takt zur Verfügung. Ungeachtet dessen sind 60 bis 70 Watt Package Power bei reiner CPU-Last sowie bis zu 100 Watt bei GPU-Last signifikant weniger als bei anderen aktuellen Highend-(Grafik)prozessoren und damit extrem effizient.

Der Core i9-12900K ist bei einem fixen Power-Limit (PL1) von 65 Watt viel langsamer als der M1 Ultra, die von Apple genannten 90 Prozent Vorsprung sind nicht völlig aus der Luft gegriffen: In Adobe Premiere (CPU-Transcoding von 8K RED) kommen wir auf 86 Prozent, im Geekbench 5 (nT) auf 82 Prozent und in Blender (Classroom) noch auf 73 Prozent. Auch mit 125 Watt kann der Core i9-12900K nicht am M1 Ultra vorbeiziehen, erst ungedrosselt – was 290 Watt in Blender bedeutet! – schiebt er sich leicht in Front. Immerhin ist die Singlethread-Performance des erst im November 2021 erschienenen 12900K höher, allerdings nutzt der M1 Ultra den gleichen 3,2-GHz-P-Core wie schon der M1 anno 2020.

Anzeige

Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.

Hinsichtlich der GPU-Performance können wir Apple mit Blick auf den 3DMark und den GFXBench attestieren, dass in etwa die Leistung einer Geforce RTX 3090 erreicht wird – bei locker 200 Watt weniger. Zumindest die von uns verwendete, nahezu genauso flotte Geforce RTX 3080 Ti mit 350 Watt ist mal schneller und mal langsamer, der M1 Ultra begnügt sich jedoch mit 90 bis 100 Watt. Mangels dedizierten Raytracing-Einheiten ist der Chip jedoch bei Blender trotz neuem Metal-Support chancenlos, da Nvidia hier die RT-Cores via Optix nutzt (und schon mit CUDA die Render-Zeit des M1 Ultra weit unterboten wird).

An dieser Stelle noch ein paar Worte zu den achtfach ausgelegten Decode/Encode-Einheiten des M1 Ultra: Durch diese ist es möglich, in einem mit Final Cut Pro erstellten Projekt flüssig durch die Timeline zu scrubben, bei dem gleich 18 (!) hochauflösende 8K30-Streams mit ProRes422-Codec eingebunden sind. Kommen wir zum Resümee!

Apple M1 Ultra: Verfügbarkeit und Fazit

Der M1 Ultra ist derzeit einzig als optionaler Prozessor im Mac Studio erhältlich, genauer bei der teureren Version(öffnet im neuen Fenster): Das Modell mit dem teildeaktivierten M1 Ultra (20P+4E+48G) sowie 64 GByte RAM und 1 TByte SSD-Speicher kostet 4.600 Euro, für 1.150 Euro Aufpreis gibt es den Vollausbau (20P+4E+64G) des M1 Ultra mit schnellerer Grafikeinheit. Für 128 GByte RAM sind weitere 920 Euro fällig, für bis zu 8 TByte SSD-Kapazität sind es bis zu 2.530 Euro – ohne Software kann der Mac Studio also bis 9.200 Euro kosten.

Fazit

Beim M1 Max hatten wir getitelt, dass der Chip schlicht eine ganz irdische Glanzleistung sei. Der M1 Ultra ist zwar immer noch nicht extraterrestrisch, der Konkurrenz aber in mancherlei Hinsicht so weit enteilt, dass sich dieser Eindruck fast schon aufdrängt: Der Apple-Prozessor legt sich dank Dual-Die-Ansatz tatsächlich mit der aktuell schnellsten Desktop-Hardware an und erreicht eine ähnliche Performance bei signifikant geringerer Leistungsaufnahme.

Beeindruckend ist dabei vor allem, dass sich die Kombination aus Core i9-12900K und Geforce RTX 3090 unter keinen Umständen in einem System wie dem Mac Studio (Test) unterbringen lassen würde, ohne massiv an Geschwindigkeit einzubüßen. Der M1 Ultra hingegen brilliert darin, eine exzellente Mischung aus Leistung und Energiebedarf in einem durchaus kompakten Gehäuse samt leiser Kühlung abzuliefern. Und ja, da hat gerade wieder jemand laut "amazing" gedacht!

Anzeige

Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.

An dieser Stelle könnten wir nun erneut das Argument anführen, dass sich Apple die Performance und Leistungsaufnahme des M1 Ultra im wahrsten Sinne des Wortes erkauft hat, denn zwei so große Chips mit TSMCs N5-Verfahren produzieren zu lassen, ist ein teures Vergnügen. Allerdings zeigt sich auch, dass der Ansatz der doppelten Dies trotz des immens schnellen Interconnects nicht durchweg skaliert, da Apple beim Power-Target zurückhaltend agiert – gerade was die Grafikeinheit anbelangt. Wir sind ergo gespannt, ob Apple beim Mac Pro tatsächlich vier Chips koppelt.


Relevante Themen