Core i9-12900K (Alder Lake) im Test: Das Intelperium schlägt zurück
Nach sieben Generationen an 14-nm-Prozessoren mit Skylake-Technik ist es endlich so weit: Mit Alder Lake bringt Intel einen Chip, an dem alles neu ist, selbst die Plattform und der Speicher brechen (fast) vollständig mit dem Althergebrachten. Dieser radikale Umbruch sorgt – trotz eines unnötigen Negativpunktes – dafür, dass Alder Lake die beste Intel-Generation seit Sandy Bridge ist.
Für Intel markiert Alder Lake den Beginn einer neuen Ära, denn die Prozessoren werden erstmals mit Intel 7 (einst 10 nm Enhanced Super Fin alias 10+++ nm) gefertigt und es sind die ersten ihrer Art, die ein hybrides Design mit heterogenen CPU-Kernen nutzen. Überdies unterstützt Alder Lake den neuen DDR5-Speicherstandard und als erster Desktop-Chip auch PCIe Gen5.
Wo also fangen wir an? Starten wir mit den Prozessoren, die ab heute verfügbar sind: Nominell gibt es sechs davon, wobei es es sich bei genauerer Betrachtung nur um drei Modelle handelt, die als Version mit und ohne integrierter Grafikeinheit verkauft werden. Am Ende bleibt die Wahl zwischen einem Core i9, einem Core i7 und einem Core i5.
Der i9 grenzt sich deutlicher ab
Anders als noch bei Rocket Lake, dem 14-nm-Backport eines 10-nm-Designs, fällt die Produktdifferenzierung zwischen Topmodell und Vize wieder größer aus: Der Core i9-12900K hat mehr CPU-Kerne und mehr L3-Cache als der Core i7-12700K, der Core i5-12600K als vorerst kleinster Ableger wurde noch einmal zusätzlich gestutzt.
| Kerne (P+E) | P-Cores | E-Cores | L3 | Grafik | PBP | MTP | |
|---|---|---|---|---|---|---|---|
| Core i9-12900KS | 8C/16T + 8C | 3,4 bis 5,5 GHz | 2,5 bis 4,0 GHz | 30 MByte | Xe (32 EU) | 150 Watt | 241 Watt |
| Core i9-12900K(F) | 8C/16T + 8C | 3,2 bis 5,2 GHz | 2,4 bis 3,9 GHz | 30 MByte | Xe (32 EU)* | 125 Watt | 241 Watt |
| Core i9-12900(F) | 8C/16T + 8C | 2,4 bis 5,0 GHz | 1,8 bis 3,8 GHz | 30 MByte | Xe (32 EU)* | 65 Watt | 202 Watt |
| Core i7-12700K(F) | 8C/16T + 4C | 3,6 bis 5,0 GHz | 2,7 bis 3,8 GHz | 25 MByte | Xe (32 EU)* | 125 Watt | 190 Watt |
| Core i7-12700(F) | 8C/16T + 4C | 2,1 bis 4,9 GHz | 1,6 bis 3,6 GHz | 25 MByte | Xe (32 EU)* | 65 Watt | 180 Watt |
| Core i5-12600K(F) | 6C/12T + 4C | 3,7 bis 4,9 GHz | 2,8 bis 3,6 GHz | 20 MByte | Xe (32 EU)* | 125 Watt | 150 Watt |
| Core i5-12600 | 6C/12T | 3,3 bis 4,8 GHz | - | 18 MByte | Xe (32 EU) | 65 Watt | 117 Watt |
| Core i5-12500 | 6C/12T | 3,0 bis 4,6 GHz | - | 18 MByte | Xe (32 EU) | 65 Watt | 117 Watt |
| Core i5-12400(F) | 6C/12T | 2,5 bis 4,4 GHz | - | 18 MByte | Xe (24 EU)* | 60 Watt | 117 Watt |
| Core i3-12300 | 4C/8T | 3,5 bis 4,4 GHz | - | 12 MByte | Xe (24 EU) | 60 Watt | 89 Watt |
| Core i3-12100(F) | 4C/8T | 3,3 bis 4,3 GHz | - | 12 MByte | Xe (24 EU)* | 60 Watt | 89 Watt |
Wer einen Blick in die Tabelle wirft, könnte sich von all den Abkürzungen und Zahlen erschlagen fühlen – aber keine Sorge, wir erläutern auf den folgenden Seiten detailliert, was es damit auf sich hat. Zuerst das Wichtigste: Alder Lake nutzt einen neuen Sockel, ist aber dennoch zu DDR4-Speicher und bisherigen Kühlern kompatibel.
Die Funktionsweise der Prozessoren und die Möglichkeiten der Plattform unterscheiden sich allerdings teils radikal von dem, was Intel in den Jahren zuvor entwickelt und angeboten hat. Aus (leistungs)technischer Sicht ist Alder Lake daher so spannend wie kaum eine andere x86-CPU der jüngeren Vergangenheit, also los geht's!
Sockel LGA 1700 samt PCIe Gen5
Nach den Sockeln LGA 1155, LGA 1156, LGA 1156 v2 und LGA 1200 zeigt schon die Bezeichnung des neuen Sockels LGA 1700 einen signifikanten Unterschied auf: Die Land-Grid-Array-Fassung weist mal eben über 40 Prozent mehr Federkontakte im Sockel auf, da die Verschaltung der Prozessoren deutlich komplexer ist.
Der LGA 1700 hat CPU-bedingt eine rechteckige statt quadratische Form, die Klappe und der Arretierungshebel befinden sich auf unterschiedlichen statt auf derselben Seite. Die Verriegelung des Sockels funktioniert im Endeffekt genauso wie bisher, wobei wie gehabt kleine Nasen verhindern, dass der Chip falsch eingesetzt wird.
Mit der neuen Fassung geht eine geänderte Halterung für CPU-Kühler einher, wobei die meisten Hersteller schon entsprechend Retention-Kits anbieten oder die Hauptplatinen noch zusätzlich Löcher für ältere Modelle aufweisen. In einigen Fällen ist der Anpressdruck jedoch nicht ausreichend, weshalb dieser vor der finalen Inbetriebnahme geprüft werden sollte.
PCIe Gen5 und DDR5
Hintergrund des LGA 1700 ist die Infrastruktur: Alder Lake unterstützt als erste Desktop-Plattform den DDR5-Standard, wenngleich die Chips auch mit DDR4-Arbeitsspeicher umgehen können und entsprechende Boards verkauft werden. Hinzu kommt, dass Alder Lake die Grafikkarte im obersten Slot mit PCIe Gen5 x16 statt mit Gen4 x16 anbindet. Gen5 verdoppelt die theoretische Durchsatzrate auf 32 GT/s und damit 63 GByte/s bei einem x16-PEG-Slot, allerdings gibt es noch keine solchen Pixelbeschleuniger.
Wie schon bei Rocket Lake ist in der CPU überdies PCIe Gen4 x4 für einen M.2-Slot für eine NVMe-SSD vorhanden, die gesamte Lane-Konfiguration liegt gar bei 16+4+8. Diese weiteren acht Bahnen sind für die Kopplung des Mainboard-Chips via DMI 4.0 (sprich PCIe Gen4 x8) gedacht, konkret den Z690. Er weist zusätzliche Lanes auf, konkret bis zu PCIe Gen4 x12 und bis zu PCIe Gen3 x16.
USB 3.2 Gen2x2 (10 GBit/s) nativ
Parallel dazu unterstützt der Z690 bis zu acht Sata-6-GBit/s-Ports, allerdings werden diese wie üblich von alternativ zu belegenden HSIO-Lanes angesteuert (siehe Bild #5 in der Galerie). Im Endeffekt liegt es am Mainboard-Hersteller, ob er lieber mehr Sata-Ports oder lieber mehr PCIe-Gen3/Gen4-Lanes anbietet. Alternativ werden Sata-Controller wie die von Asmedia angebunden, was wieder Lanes kostet.
Bei den USB-Ports geht Intel ähnlich vor: Hier sind prinzipiell bis zu zehn USB 3.2 Gen2 (5 GBit/s) vorhanden, wobei acht davon auch als bis zu vier USB 3.2 Gen2x2 (10 GBit/s) umgewandelt werden können. Der Z690 hat somit effektiv mehr USB-Kapazitäten als der Z590 und erstmals gibt es den schnellsten USB-Standard nativ; Thunderbolt 4 muss per Controller realisiert werden.
Weil DDR5 als neuer Standard mannigfaltige Verbesserungen mit sich bringt, bedarf es einiger Erklärungen – zumal Intels Implementierung durchaus Eigenheiten aufweist, die bei AMDs kommendem Sockel AM5 nicht zwingend identisch sind.
Erste Desktop-CPU mit DDR5-Speicher
Auch wenn wir verkürzt von DDR5 sprechen, genau genommen ist DDR5-SDRAM gemeint, also Double Data Rate Synchronous Dynamic Random Access Memory der fünften Generation. Dieser weist im Vergleich zu DDR4 allerhand Verbesserungen auf, die neben der Leistung auch die Effizienz und die Kapazität steigern.
Grundsätzlich hat DDR5 eine signifikant höhere Transferrate, das Speichergremium hat derzeit bis zu DDR5-6400 spezifiziert und Hersteller wie Gskill haben bereits Kits mit bis zu DDR5-7000 vorgestellt. Zum Vergleich: Bei DDR4 ist offiziell DDR4-3200 das Limit, wenngleich es ungeachtet dessen auch OC-Kits mit bis zu DDR4-5000 gibt.
Hierbei gilt zu berücksichtigen, dass die effektive Bandbreite um gut ein Drittel steigt, wenn DDR4-3200 mit DDR5-3200 verglichen wird. Auch lassen rechnerische Zugriffszeiten(öffnet im neuen Fenster) wie 8.75 ns bei DDR4-3200-CL14 im Gear1-Modus (voller Speichercontroller-Takt) und 15 ns bei DDR5-4800-CL36 im Gear2-Modus (halbierte IMC-Frequenz) keine direkten Rückschlüsse auf die reale Performance zu, da die Latenz weiteren Faktoren unterliegt.
Höhere Parallelität für schnellere Zugriffe
So wird ein DDR5-Modul wie gehabt an einen 64-Bit-Speicherbus (64 Bit zuzüglich 8 Bit ECC-Speicherkorrektur) angeschlossen, arbeitet intern aber anders als DDR4 mit zwei voneinander unabhängigen 32-Bit-Kanälen (32 Bit zuzüglich 8 Bit ECC, jeweils in doppelter Ausführung). Möglich wird das durch die von 8 auf 16 verdoppelte Burst Length zugunsten der Parallelität, denn jeder Channel kann so unabhängig voneinander 64 Byte in einem Rutsch an die CPU senden, was einer Cache-Line bei aktuellen Prozessoren entspricht.
Bei DDR5 erfolgt das Daten-Prefetching mit 16n statt 8n gleichzeitigen Zugriffen und die Anzahl der Speicherbankgruppen (Bank Groups) bei gleicher Menge an Bänken (Banks) pro Gruppe verdoppelt sich (8Gx4B statt 4Gx4B). Dadurch sinken die Latenzen und die Effizienz bei Lese- sowie Schreibvorgängen steigt, weil Bänke innerhalb einer Speicherbankgruppe unter anderem dasselbe I/O-Routing nutzen und so mehr Speicherseiten (Pages) geöffnet bleiben können.
XMP 3.0 als 1-Klick-Lösung
Überdies gibt es bei DDR5 mit Same Bank Refresh (REFsb) eine Technik, bei welcher nur eine statt alle vier Bänke vor einer Auffrischung in einen Ruhemodus ohne Datenaktivität versetzt werden müssen. Verglichen mit All Bank Refresh (REFab) bei DDR4 soll dadurch der Durchsatz um 6 bis 9 Prozent steigen und sich die durchschnittliche idle-Latenz von 11 ns auf 5 ns mehr als halbieren.
| DDR4 | DDR5 | |
|---|---|---|
| Datenübertragungsrate | DDR4-3200 (Jedec) | DDR5-6400 (Jedec) bis DDR5-8400 |
| Bandbreite (theoretisch) | 25,6 GByte/s pro Kanal | 38,4 GByte/s bis 67,2 GByte/s pro Kanal |
| Datenleitungen | 64+8 Bit mit ECC | 32+8 Bit mit ECC in doppelter Ausführung |
| SDRAM-Die-Kapazität | bis zu 16 GBit (DUV) | bis zu 64 GBit (EUV) |
| DIMM-Kapazität (Desktop) | bis zu 32 GByte | bis zu 128 GByte |
| DIMM-Kapazität (Server) | bis zu 256 GByte | bis zu 1 TByte |
| Prefetching | 8n | 16n |
| Speicherbänke | 4 Gruppen mit 4 Bänken | 8 Gruppen mit 4 Bänken |
| Auffrischung | All Bank Refresh (REFab) | Same Bank Refresh (REFsb) |
| Burst Length | 8 | 16 |
| Spannung (VDD/VPP) | 1,2 Volt/2,5 Volt | 1,1 Volt/1,8 Volt |
Damit beim Einbau der Speichermodule keine aufwändige manuelle Konfiguration notwendig ist, hat Intel den XMP-Standard aktualisiert: Via Extreme Memory Profile 3.0 werden im Mainboard-BIOS mit einem Klick der Takt und die (Sub)latenzen sowie die Spannung entsprechend der Herstellerspezifikationen gesetzt, indem diese aus dem SPD-Speicher (Serial Presence Detect) des RAM-Sticks ausgelesen werden.
Abschließend noch eine prinzipielle Anmerkung zu den uns vorliegenden DDR5-Kits von Corsair, Crucial sowie Gskill: Alle Riegel haben 16 GByte und nutzen einen Single-Rank-Aufbau(öffnet im neuen Fenster), was die Performance etwas einschränkt. Bei praktisch jedem DDR4-Modul mit 16 GByte wird hingegen durch Dual-Rank und somit Bank-Interleaving die Leistung pro Takt erhöht, was sich mit dem Thaiphoon Burner(öffnet im neuen Fenster) prüfen lässt.
Nachdem wir den Arbeitsspeicher theoretisch abgehandelt haben, geht es mit der Technik der CPU-Kerne weiter. Hier macht Intel den größten Sprung seit vielen Jahren, sowohl was den Ansatz als auch was die Leistung pro Takt (IPC) anbelangt.
Hybrid-Architektur erklärt
Alle bisherigen Desktop-Prozessoren von Intel basieren auf einem homogenen Design: Gemeint ist, dass alle Kerne eine identische Architektur nutzen und sich selbst bei der maximalen Frequenz nicht unterscheiden. Mit Alder Lake erfolgt der Wechsel auf einen heterogenen Ansatz, von Intel als Hybrid-Technik bezeichnet.
Die Idee ist nicht neu, im Smartphone-Segment wird sie als Big/Little-Implementierung seitens ARM und Lizenznehmern wie Apple oder Qualcomm seit vielen Jahren erfolgreich umgesetzt. Intel selbst hatte mit Lakefield schon einen ersten x86-Hybrid veröffentlicht, allerdings ohne nennenswerte Marktresonanz.
Um zu verstehen, warum ein heterogenes Design sinnvoll ist, gilt es die relevanten Metriken zu kennen: Egal ob Desktop, Laptop oder Smartphone – am Ende zählt das Verhältnis der sogenannten PPA-Faktoren (Performance, Power, Area). Diese legen fest, wie viel Fläche sowie Energie für eine bestimmte Geschwindigkeit und die gewünschten Fertigungskosten zur Verfügung stehen. Die Anzahl der Chips pro Wafer spielt dabei eine wichtige Rolle, da hier die maßgeblichen Kosten anfallen.
Maximale Performance pro Fläche pro Watt
Intels Philosophie ist es, die Mainstream-CPUs grob auf 150 mm² bis 200 mm² zu begrenzen, damit die Produktion entsprechend günstig (oder weniger teuer) ist. Das Ziel lautet also, möglichst viel Leistung pro Quadratmillimeter pro Watt unterzubringen, weshalb für Alder Lake ein hybrides Design auserkoren wurde. Statt von Big/Little- spricht Intel von Performance/Efficiency-Cores, wovon es jeweils acht gibt (8P+8E).
Die P-Kerne basieren auf der Golden Cove genannten Architektur, sie unterstützen Hyperthreading (SMT) und sollen pro Takt gleich 19 Prozent flotter sein als die Cypress-Cove-Technik in Rocket Lake. Die E-Kerne nutzen die Gracemont-Architektur, diese soll eine IPC ähnlich der alten Skylake-Implementierung aufweisen, die Intel vom Core i7-6700K bis zum Core i9-10900K verwendet hat. Die P/E-Kerne nutzen AVX2, die SGX-Enklave flog raus.
Alder Lake wird mit dem Intel-7-Verfahren produziert, einst als 10 nm Enhanced Super Fin alias 10+++ nm bezeichnet. Der 8P+8E-Chip inklusive Xe-Grafikeinheit, L3-Cache und I/O-Subsystem weist eine Fläche von 209 mm² auf (zur Anzahl der Transistoren gibt es keine Aussage). Die acht P-Cores von Alder Lake benötigen inklusive je 1,25 MByte L2-Cache pro Kern rund 61 mm², die acht E-Cores samt 2 MByte L2-Cache für alle zusammen geringe 17 mm². Überdies brauchen sie für dieselbe Performance signifikant weniger Energie, sodass die Performance pro Quadratmillimeter pro Watt entsprechend besser ausfällt.
Stellt sich die Frage, wie Intel sicherstellt, dass immer die richtigen Kerne rechnen – die Antwort darauf ist eine in Hardware gegossene Lösung.
Thread Director zur Lastverteilung
Weil ein Alder Lake wie der Core i9-12900K insgesamt 24 logische Kerne respektive Threads aufweist (8P mit 8C/16T und 8E mit 8C/8T) aufweist, kommt dem Scheduling eine besondere Bedeutung zu. Hierfür hat Intel den PCU (Power Control Unit) genannten Microcontroller erweitert, damit dieser Thread Director in Echtzeit die Verwaltung der anfallenden Workloads optimiert.
Hierzu überwacht er den Mix der eingehenden Instruktionen im Nanosekundentakt, parallel dazu werden fortwährend die thermischen Kapazitäten des Chips geprüft. All diese Telemetrie-Daten gibt der Thread Director basierend auf einem vorab trainierten Modell gebündelt an den Scheduler des Betriebssystems weiter, damit dieser die eigentliche Lastverteilung einleiten kann – wenngleich nicht zwingend muss.
Intel teilt die Workloads grob in vier Kategorien ein: Class #3 ist eher speicherzugriffslastig und daher nicht Compute-limitiert, sie landen auf den E-Cores. Class #2 nutzt AVX- oder AI/VNNI-Instruktionen und unter Class #1 fallen AVX2-Befehle, weshalb hier die P-Cores die erste Wahl sind. Die Class #0 umfasst die meisten sonstigen Anwendungen, die ebenfalls von den P-Cores abgedeckt werden.
Die Qual der Wahl
Spannend ist beispielsweise, dass bei Multithreading-Apps oder in stark parallelisierten Spielen die ersten acht Threads auf den P-Cores starten, der neunte bis sechzehnte auf den E-Cores läuft und erst ab dem siebzehnten die logischen SMT-Kerne der P-Cores belastet werden. Das ergibt durchaus Sinn, da für wenige Threads somit die vollen CPU-Ressourcen zur Verfügung stehen.
Dieses Verhalten zeigt sich unter Windows 10 genauso wie unter Windows 11, wobei Intel zufolge der Scheduler des neuen Betriebssystems besser für ein hybrides CPU-Design vorbereitet sein soll. Generell landen interaktive und responsive Aufgaben sowie leichte Vordergrundlast auf den schnellen Golden Coves, sonstige Hintergrundarbeiten auf den effizienten Gracemonts.
Zumindest im Desktop-Betrieb konnten wir keine nennenswerten Unterschiede zwischen beiden Windows-Versionen feststellen, weder bei der Performance noch bei der Leistungsaufnahme – bei Laptops mag das anders sein. Laut Intel ist Windows 11 in der Lage, nicht nur den Energiebedarf, sondern auch die Effizienz der Kerne zu berücksichtigen, was der Akkulaufzeit zugute kommen soll.
Obacht unter Windows 10
Ein paar Ausrutscher gibt es beim Thread Director dann aber doch: Der y-Cruncher(öffnet im neuen Fenster), welcher per AVX2 die Zahl Pi im RAM berechnet, nutzt im Singlethread-Test mit egal welchem Microsoft-OS einen E- statt einen P-Core. Unter Windows 10 läuft überdies auch der Multithreading-Test einzig auf den Efficiency-Kernen und POV-Ray(öffnet im neuen Fenster) ist aus demselben Grund nur halb so schnell wie unter Windows 11, das Light-Baking in der Unreal Engine 4 wird bei der Meerkat-Demo(öffnet im neuen Fenster) einzig auf den Little-Cores berechnet.
Wenngleich ein hybrides Design darauf ausgelegt ist, die Flächen- und Energie-Effizienz zu erhöhen, kann zugunsten der maximalen Performance dieser Aspekt ignoriert werden. Für die Alder Lake im Desktop-Segment hat Intel genau das gemacht, um mit aller (Watt-)Gewalt die letzten paar Quäntchen an Geschwindigkeit freizulegen.
241 Watt sind der neue Standard
Bedingt durch das sich verzögernde 10-nm-Verfahren musste Intel vom Core i7-6700K bis zum Core i9-11900K auf die alte 14-nm-Technik und die Skylake-Architektur setzen, dabei aber immer mehr Kerne bei immer höherem Takt verbauen. Nominell stieg die thermische Verlustleistung (Thermal Design Power, TDP) nur von 91 Watt auf 125 Watt – praktisch jedoch hat sie sich mehr als verdoppelt.
In der Theorie unterscheidet Intel bis heute (siehe PDF auf Seite #76(öffnet im neuen Fenster)) zwischen der TDP, auch als dauerhaftes PL1 (Power Limit #1) bezeichnet, und einem kurzfristigen Boost, dem PL2. Dieses gestattet eine signifikant höhere Verlustleistung für mehr Takt, zuletzt bis zu 251 Watt bei Rocket Lake. Das klappt deshalb, weil die thermische Trägheit dafür sorgt, dass der Prozessor samt Kühler in dieser kurzen Zeit nicht überhitzt, weil sich Wärme langsam ausbreitet.
Die Spanne des PL2 wird zudem durch den TAU (Turbo Time Parameter) begrenzt, welchen Intel von einst 28 auf 56 Sekunden erweitert hat. Praktisch aber reduziert ein EWMA (Exponentially Weighted Moving Average(öffnet im neuen Fenster)), also ein exponentiell gewichteter gleitender Mittelwert, dieses Zeitfenster – denn je häufiger die CPU unter Last läuft, desto kürzer wird das TAU, damit das PL1 im Durchschnitt erhalten bleibt.
Maximum Turbo Power aka "It's over 9000!(öffnet im neuen Fenster)"
Nur: Bei 125 Watt erreichen Intels Prozessoren nicht ansatzweise die beworbenen Taktraten auf allen Kernen, hierfür ist mehr Energie nötig. Nahezu jedes Highend-Mainboard der vergangenen Jahre hat daher PL1 und TAU ignoriert, stattdessen wurde das PL2 ohne zeitliche Beschränkung angelegt. Bei Chips bis einschließlich dem Core i9-9900K und deren Leistungsaufnahme (95 Watt PL1 x 1,25 = 119 Watt PL2) war das kein Problem, bei den satten 250 Watt seit Comet Lake alias Core i9-10900K hingegen schon.
Intel hat dieses Vorgehen seit jeher stillschweigend toleriert und argumentiert, ein die TDP übersteigendes höheres Power-Limit sei ja kein Overclocking wie das Anheben der CPU-Frequenzen über die Spezifikationen hinaus. Mit Alder Lake macht Intel keinen Hehl mehr aus der Brechstange, stattdessen wird damit sogar auch noch geworben.
Während in der technischen Dokumentation die TDP alias PL1 nun als PBP (Processor Base Power) bezeichnet wird, taucht im Marketing-Material erstmals der Begriff der MTP (Maximum Turbo Power) auf. Gemeint ist damit schlicht ein dauerhaftes PL2 ohne Zeitbeschränkung – der neue Standard laut Intel, was die Partner dankend annehmen und als Voreinstellung in die Firmware ihrer Hauptplatinen programmiert haben.
Die Brechstange für AMDs Ryzen 9 5950X
Alle uns vorliegenden Platinen verwenden 241 Watt ohne Rückfrage, was eine sehr starke Kühllösung voraussetzt. Faktisch wird aus einem als 125-Watt-Chip beworbenen Prozessor eine 209-mm²-Heizplatte mit doppelt so hoher thermischer Verlustleistung, was sich einzig in den Tiefen des Mainboard-BIOS ändern lässt.
So erreichen wir mit einem Noctua NH-D15S(öffnet im neuen Fenster) und geprüft korrektem Anpressdruck nach 15 Minuten in Blender nicht nur besagte 241 Watt als Package Power, sondern auch eine Temperatur von 93 Grad. Mit Prime95 und AVX2 sind es 270 Watt ohne künstliches Limit – hier braucht es eine Wasserkühlung. Nur gut, dass Intel den verlöteten Heatspreader (IHS) dicker als zuvor gemacht hat, das Lot (STIM) und das Silizium-Die selbst aber flacher (Thinning), was insgesamt den Wärmedurchgang verbessert.
Die 241 Watt täuschen darüber hinweg, dass Alder Lake seine Performance schon bei 125 Watt weitestgehend voll abrufen kann – es fehlen dann aber einige Prozentpunkte, um zu AMDs Ryzen 9 5950X aufzuschließen. Womit wir bei den Benchmarks wären!
In Anwendungen sehr flott
Wir testen Alder Lake auf einem Asus ROG Maximus Z690 Hero für DDR5 (Firmware v0702) und auf einem Asus ROG Strix Z690-A Gaming WiFi D4 für DDR4 (Firmware v0702), für Rocket Lake kam ein Asus ROG Maximus XIII Hero (Z590, Firmware v1007) zum Einsatz. Für die Ryzen-CPUs wiederum haben wir ein Asus Crosshair VIII Hero WiFi (X570, Firmware v3801) verwendet.
Jegliche Apps sowie Windows 10 v21H2 und Windows 11 v21H2 (VBS an, HVCI aus) liegen auf einer Crucial P5 Plus, einer der schnellsten derzeit verfügbaren PCIe-Gen4-NVMe-SSDs. Als Grafikkarte nutzen wir eine Geforce RTX 3080 Ti (Test) samt rBAR von Nvidia, als Netzteil kommt ein Seasonic Prime TX mit 1.000 Watt zum Einsatz.
Getestete Anwendungen
- 7-Zip (reales Packen)
- Adobe Premiere Pro (PugetBench)
- AV1 Encoding (Tears of Steel)
- Blender (Cycles)
- Cinebench R15/R20/R23
- Digicortex Spike Bench
- Faststone Image Viewer
- UL Procyon Office (Microsoft 365)
- Unreal Engine 4 (Light Baking)
- y-Cruncher (AVX2/AVX-512)
Zunächst einmal das Offensichtliche: Mit Alder Lake vollführt Intel den größten Leistungssprung im Desktop-Segment seit dem Core 2 Duo, was neben der verdoppelten Kernzahl auf die IPC und den DDR5-Speicher zurückzuführen ist. Der Core i9-12900K ist stellenweise doppelt so schnell wie der Core i9-11900K, durchschnittlich sind es enorme 38 Prozent Vorsprung. Selbst viele Singlethread-Workloads legen anständig zu, rund 15 Prozent Zuwachs ergeben die Messwerte.
Verglichen mit AMDs Ryzen 9 5950X rechnet Core i9-12900K in unserem App-Parcours etwa 10 Prozent flotter, zumindest bei 241 Watt, mit DDR5-Speicher und wenn Alder Lake unter Windows 11 läuft. Nutzen wir hingegen nur 125 Watt oder DDR4-Speicher, verringert sich der Vorsprung jeweils um 5 Prozentpunkte – und wenn dann noch Windows 10 verwendet wird, fällt der Core i9-12900K aufgrund einiger Scheduler-Probleme hinter die Vermeer-CPU zurück.
Schneller Speicher und Thread Director helfen
Ob DDR5-4800-CL36 oder DDR4-3200-CL14 eingesetzt wird, macht bei der Mehrheit der Software keinen Unterschied, da diese selten RAM-limitiert ist. Die einzigen Unterschiede zugunsten des neuen Speicherstandards messen wir beim Packprogramm 7-Zip (+24%), beim H.264-Encoding mit Adobe Premiere (+35%), beim Simulieren von Neuronen mit Digicortex (+51%) und beim Berechnen der Zahl Pi mit dem y-Cruncher (+31%).
Hier zeigt sich der einzige Ausfall des Thread Director von Alder Lake unter Windows 11, denn wenn wir das In-Memory-Computing mit einem Thread starten, landet dieser auf einem E-Core. Schalten wir jegliche Efficiency-Kerne ab und nutzen nur die P-Cores, läuft der y-Cruncher dank deren AVX-512 sehr viel schneller (auch wenn Intel offiziell behauptet, dass AVX-512 nicht verfügbar wäre). Auf diese Weise können wir auch prüfen, wie viel Leistung durch die E-Cores hinzukommt.
Klein, aber oho
Sofern eine Anwendung nicht RAM-limitiert ist, bringen die acht vermeintlichen Little-Kerne eine ganze Menge. Egal ob Adobe Premiere, Blender, Cinebench, Unreal Engine 4 oder y-Cruncher: Der Zuwachs beträgt beachtliche 40 Prozent. Anteilig parallelisierte Apps wie 7-Zip (+12%) oder AV1-Encoding (+18%) profitieren ebenfalls deutlich, gleiches gilt für einige Kalkulationen in Excel, da diese alle 24 Threads des Core i9-12900K nutzen.
Mit Windows 10 funktioniert Alder Lake derzeit weitestgehend rund, einzig die Unreal Engine 4 und der y-Cruncher werden fälschlicherweise auf den E-Cores ausgeführt. Hinzu kommt, dass der UL Procyon Office Productivity mit Microsoft 365 abstürzt, sich die Büro-Software abseits des Benchmarks aber problemlos einsetzen lässt. Intel ist über diese Erkenntnisse informiert, intern wird bereits an der Fehlerbehebung gearbeitet.
Weiter geht es mit der Spiele-Performance und so viel sei gesagt, hier ist Alder Lake ein Brett.
Die aktuell beste Gaming-CPU
Wir testen Alder Lake auf einem Asus ROG Maximus Z690 Hero für DDR5 (Firmware v0702) und auf einem Asus ROG Strix Z690-A Gaming WiFi D4 für DDR4 (Firmware v0702), für Rocket Lake kam ein Asus ROG Maximus XIII Hero (Z590, Firmware v1007) zum Einsatz. Für die Ryzen-CPUs wiederum haben wir ein Asus Crosshair VIII Hero WiFi (X570, Firmware v3801) verwendet.
Jegliche Spiele sowie Windows 10 v21H2 und Windows 11 v21H2 (VBS an, HVCI aus) liegen auf einer Crucial P5 Plus, einer der schnellsten derzeit verfügbaren PCIe-Gen4-NVMe-SSDs. Als Grafikkarte nutzen wir eine Geforce RTX 3080 Ti (Test) samt rBAR von Nvidia, als Netzteil kommt ein Seasonic Prime TX mit 1.000 Watt zum Einsatz. Wir verwenden CapFrameX(öffnet im neuen Fenster), um Framerate/Frametimes zu messen.
Getestete Spiele
- Anno 1800 (Anno Engine)
- Civilization 6 (Firaxis Engine)
- Counter Strike Global Offensive (Source Engine)
- Crysis Remastered (Cry Engine 1337)
- Flight Simulator (Asobo Engine)
- Kingdom Come Deliverance (Cry Engine)
- Planet Zoo (Cobra Engine)
- Red Dead Redemption 2 (RAGE)
- Total War Troy (TWW2 Engine)
Intel hatte vorab – wenngleich mit einer veralteten Version von Windows 11, die AMDs Ryzen benachteiligte – damit geworben, dass Alder Lake der weltbeste Gaming-Prozessor sein soll. Der Hersteller sollte Recht behalten: Der Core i9-12900K schlägt den Ryzen 9 5950X mit einem Vorsprung von 12 (DDR4) bis 17 Prozent (DDR5), wobei der schnellere Speicher primär die Leistung in Planet Zoo (+9%) und vor allem in Total War Troy(öffnet im neuen Fenster) signifikant (+34%) steigert.
Spannend ist in diesem Kontext der Vergleich mit dem Core i9-11900K, denn dem Rocket-Lake-Chip gelingt es teilweise, den Core i9-12900K knapp zu schlagen oder gleichzuziehen. Hintergrund dürfte das Cache-Subsystem sein, denn größere Puffer gehen oft mit höheren Latenzen einher, auf die Spiele negativ reagieren. Intels eigene Werte bestätigen unsere Resultate, sprich Alder Lake stellt manchmal einen Rückschritt dar.
Kleine Kerne besser aktiv lassen
Eine der oft gestellten Fragen der vergangenen Wochen war, ob für Spiele die Little-Cores nicht am besten im BIOS abgeschaltet werden sollten. Wir können das mittlerweile klar verneinen, denn die Mehrheit der von uns getesteten Titel läuft mit den E-Kernen runder. Hier und da gibt es Vorteile, wenn rein die P-Cores aktiv sind, dafür profitieren mehrere Spiele mit rund 10 Prozent und Total War Troy mit 20 Prozent.
Ob Windows 10 oder Windows 11 genutzt wird, ist anders als bei den Anwendungen nahezu egal. Zwar gibt es in Civilization 6 und in CSGO messbare, aber nicht spürbare Unterschiede. Schwerwiegender finden wir, dass Anno 1800 unter Windows 10 auf unserem Testsystem durchweg abstürzt – eine Lösung ließ sich nicht finden. Prinzipiell kann Alder Lake aufgrund der Hybrid-Architektur bei Titeln mit Denuvo-DRM den Start verhindern, Intel will aber mit Patches nachhelfen. Eine Liste der betroffenen Spiele(öffnet im neuen Fenster) und eine Anleitung für den Legacy Game Compatibility Mode(öffnet im neuen Fenster) finden sich bei Intel, dieser deaktiviert temporär die E-Cores.
Bei all der Performance, die Alder Lake liefert – wie sieht es denn bei der Leistungsaufnahme aus? Die 241 Watt sind schließlich nur das obere Limit, die längst nicht alle Spiele oder Apps ausreizen, wie Bildraten beim Gaming mit 125-Watt-Power-Target bereits implizieren.
Die Effizienz steigt dank 10 nm
Um herauszufinden, wie viel Energie sich der Core i9-12900K und die anderen getesteten Prozessoren genehmigen, haben wir deren Package Power in Anwendungen und Games protokolliert. Daraus ergibt sich neben den absoluten Werten auch ein Verhältnis wie Fps/Watt, Punkte/Watt oder Zeit/Watt.
Aufgrund der 14-nm-Technik mit über die Jahre steigender Kernzahl sowie höherem Takt galten Intels CPUs zu Recht als ineffizient. Vor allem Rocket Lake wie der Core i9-11900K stellen hier als 10-nm-Backport den bisherigen Tiefpunkt dar, mit dem Core i9-12900K hingegen dreht sich das Verhältnis.
Dabei gilt es jedoch klar zwischen den beiden Betriebspunkten des Chips zu unterscheiden: Mit einer Processor Base Power von 125 Watt ist das Alder-Lake-Topmodell schneller und sparsamer als sein Rocket-Lake-Vorgänger, mit einer Maximum Turbo Power von 241 Watt hingegen steigt die Performance nur wenig und ruiniert somit die Effizienz.
Spiele benötigen zumeist wenig Energie
Weil das Power-Limit allerdings nur die Obergrenze darstellt und keine fixe Wattage, schwankt die reale Leistungsaufnahme stark. Während der Core i9-11900K noch oft über 150 Watt und im Extremfall sogar über 200 Watt in Games abgibt, sind es beim Core i9-12900K meist rund 90 Watt – so wie beim Ryzen 9 5950X auch. Einzig in Total War Troy liegt die Package Power des i9 mit 170 Watt weit über der des AMD-Chips, was sich aber auch in sehr viel mehr Bildern pro Sekunde äußert.
Für Anwendungen ist eine Maximum Turbo Power von 241 Watt primär als Brechstange zu sehen, die Intel ansetzt, um dem 16-kernigen Ryzen 9 5950X den Schneid abzukaufen. Der reizt bei Software wie Blender seine 142 Watt voll aus, weshalb Intel hier ebenfalls in die Vollen gehen muss – der höchstmögliche Takt erfordert überproportional mehr Energie.
Im besten Fall steigt die Performance um rund 15 Prozent, dabei verdoppelt sich aber die thermische Verlustleistung nahezu. Intel opfert also die Effizienz des Core i9-12900K für ein kleines Geschwindigkeitsplus, was wir als unnötig ansehen. Abseits der Stromkosten sorgt das nämlich für eine laute oder teure Kühlung, sofern nicht bewusst manuell das Power-Limit verringert wird.
Spannend ist überdies zu sehen, dass Intel die idle-Package-Power bei Alder Lake verglichen mit Rocket Lake stark reduzieren konnte. Gerade DDR4-3200 im Gear1-Modus war beim Core i9-11900K noch ein verlässlicher Stromtreiber, beim Core i9-12900K mit überarbeitetem Speichercontroller zeigt sich dieses Verhalten nicht.
Zu guter Letzt noch eine Anmerkung zur Package Power unter Windows 10: In CSGO, in Crysis Remastered und im Flight Simulator fällt diese unerwartet niedrig aus – da diese aus den MSR (Model Specific Registers) stammen, lesen alle Tools dieselben Werte aus. Wir prüfen derzeit, ob und wo das Problem liegt.
Und damit ab zum Resümee!
Core i9-12900K: Verfügbarkeit und Fazit
Intel verkauft den Core i9-12900K für rund 650 Euro, womit der Alder-Lake-Chip zwischen AMDs Ryzen 9 5900X und Ryzen 9 5950X positioniert wird. Vorerst wird es einzig Z690-Mainboards geben, die sich je nach Modell mit DDR4- oder DDR5-Speicher betreiben lassen, wobei beide Varianten bei 200 Euro starten. Es gilt: DDR5-4800-CL40 kostet ähnlich viel wie DDR4-3200-CL15.
Fazit
Alder Lake ist der Intel-Prozessor, auf den viele seit Jahren gewartet haben dürften: Das Hybrid-Design kombiniert eine sehr hohe Geschwindigkeit mit einer exzellenten Effizienz, überdies weist die Sockel-LGA-1700-Plattform allerhand technische Neuerungen von DDR5-Speicher über PCIe-Gen5-Lanes bis hin zu nativem USB 3.2 Gen2x2 auf.
Der Ansatz, heterogene CPU-Kerne zu verwenden, also quasi einen Big/Little-Prozessor zu bauen, stellt für das Desktop-Segment ein Novum dar. Das Ziel, somit die Leistung pro Quadratmillimeter und pro Watt zu maximieren, ist mit Alder Lake gelungen. Hierbei hilft das endlich lauffähige 10-nm-Verfahren in der vierten Iteration, was mittlerweile Intel 7 heißt.
So weist der Core i9-12900K als 24-Thread-Topmodell dank der Kombination aus schnellen Performance- und sparsamen Efficiency-Kernen die derzeit klar höchste Gaming-Geschwindigkeit auf, in Anwendungen reicht es, um AMDs Ryzen 9 5950X zumeist Paroli zu bieten. Damit das klappt, hat Intel das Power-Limit für die letzten paar Prozentpunkte ohne Not auf satte 241 Watt erhöht – als Standard wohlgemerkt, was viele Kühler an ihre Grenze bringt.

Mit regulären 125 Watt betrieben, verliert der Core i9-12900K hingegen kaum an Geschwindigkeit, im Gegenteil: Dank Intel-7-Technik erweist sich der Chip als überaus effizient, er schafft mehr Fps/Watt als jeder andere Highend-Prozessor und kann je nach Workload auch bei Anwendungen mit dem konservativ eingestellten Ryzen 9 5950X (bei 142 Watt via 7-nm-Fertigung) konkurrieren.
Um die maximale Leistung abzurufen, muss Alder Lake zwar mit teurem DDR5-Speicher kombiniert werden. Ein Großteil der heutigen Software läuft mit bisherigem DDR4 aber genauso flott, weshalb der Aufpreis sich nur für bestimmte Anwendungsszenarien lohnt – hier gibt es dann teils ein Plus von 30 Prozent. PCIe Gen5 für den Grafikkarten-Slot ist ohnehin eine Wette auf die Zukunft, entsprechende Pixelbeschleuniger existieren außerhalb der Testlabore noch nicht.
Auch beim Einsatz von Windows 10 können wir Entwarnung geben: In Spielen entspricht die Performance der unter Windows 11, einzig bei zwei der von uns vermessenen Titel fällt die Bildrate leicht niedriger aus. Die meisten Anwendungen zeigen ebenfalls keine Auffälligkeiten, allerdings laufen die Unreal Engine 4 und der y-Cruncher auf den E- statt auf den P-Cores; hier dürfte ein Firmware/Software-Update folgen.
Die Rebellen-Allianz schlägt zurück
Unterm Strich ist Alder Lake trotz oder gerade wegen der vielen Neuerungen ein rundes sowie äußerst leistungsstarkes Produkt, einzig die 241-Watt-Voreinstellung empfinden wir als unnötig. Die Rebellen-Allianz, ähm, AMD bleibt derweil nicht untätig: In wenigen Wochen sollen erste Ryzen-CPUs mit 3D V-Cache erscheinen, welche den Abstand wieder deutlich verringern dürften.
- Anzeige Hier geht es zum Intel Core i9-12900K bei Alternate Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



