Thread Director zur Lastverteilung
Weil ein Alder Lake wie der Core i9-12900K insgesamt 24 logische Kerne respektive Threads aufweist (8P mit 8C/16T und 8E mit 8C/8T) aufweist, kommt dem Scheduling eine besondere Bedeutung zu. Hierfür hat Intel den PCU (Power Control Unit) genannten Microcontroller erweitert, damit dieser Thread Director in Echtzeit die Verwaltung der anfallenden Workloads optimiert.
Hierzu überwacht er den Mix der eingehenden Instruktionen im Nanosekundentakt, parallel dazu werden fortwährend die thermischen Kapazitäten des Chips geprüft. All diese Telemetrie-Daten gibt der Thread Director basierend auf einem vorab trainierten Modell gebündelt an den Scheduler des Betriebssystems weiter, damit dieser die eigentliche Lastverteilung einleiten kann - wenngleich nicht zwingend muss.
Intel teilt die Workloads grob in vier Kategorien ein: Class #3 ist eher speicherzugriffslastig und daher nicht Compute-limitiert, sie landen auf den E-Cores. Class #2 nutzt AVX- oder AI/VNNI-Instruktionen und unter Class #1 fallen AVX2-Befehle, weshalb hier die P-Cores die erste Wahl sind. Die Class #0 umfasst die meisten sonstigen Anwendungen, die ebenfalls von den P-Cores abgedeckt werden.
Die Qual der Wahl
Spannend ist beispielsweise, dass bei Multithreading-Apps oder in stark parallelisierten Spielen die ersten acht Threads auf den P-Cores starten, der neunte bis sechzehnte auf den E-Cores läuft und erst ab dem siebzehnten die logischen SMT-Kerne der P-Cores belastet werden. Das ergibt durchaus Sinn, da für wenige Threads somit die vollen CPU-Ressourcen zur Verfügung stehen.
Dieses Verhalten zeigt sich unter Windows 10 genauso wie unter Windows 11, wobei Intel zufolge der Scheduler des neuen Betriebssystems besser für ein hybrides CPU-Design vorbereitet sein soll. Generell landen interaktive und responsive Aufgaben sowie leichte Vordergrundlast auf den schnellen Golden Coves, sonstige Hintergrundarbeiten auf den effizienten Gracemonts.
Zumindest im Desktop-Betrieb konnten wir keine nennenswerten Unterschiede zwischen beiden Windows-Versionen feststellen, weder bei der Performance noch bei der Leistungsaufnahme - bei Laptops mag das anders sein. Laut Intel ist Windows 11 in der Lage, nicht nur den Energiebedarf, sondern auch die Effizienz der Kerne zu berücksichtigen, was der Akkulaufzeit zugute kommen soll.
Obacht unter Windows 10
Ein paar Ausrutscher gibt es beim Thread Director dann aber doch: Der y-Cruncher, welcher per AVX2 die Zahl Pi im RAM berechnet, nutzt im Singlethread-Test mit egal welchem Microsoft-OS einen E- statt einen P-Core. Unter Windows 10 läuft überdies auch der Multithreading-Test einzig auf den Efficiency-Kernen und POV-Ray ist aus demselben Grund nur halb so schnell wie unter Windows 11, das Light-Baking in der Unreal Engine 4 wird bei der Meerkat-Demo einzig auf den Little-Cores berechnet.
Wenngleich ein hybrides Design darauf ausgelegt ist, die Flächen- und Energie-Effizienz zu erhöhen, kann zugunsten der maximalen Performance dieser Aspekt ignoriert werden. Für die Alder Lake im Desktop-Segment hat Intel genau das gemacht, um mit aller (Watt-)Gewalt die letzten paar Quäntchen an Geschwindigkeit freizulegen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Hybrid-Architektur erklärt | 241 Watt sind der neue Standard |
Ist typisch für Apple die Kühlung auf 100C einzustellen, damit eben vorher viel...
Und das ist ein Trugschluss. Parallelisierung geht IMMER auch mit einem enormen Overhead...
OK, U-Bahn ginge mobil evtl. (ist aber oft zu voll) Was ist mit der Bahn? Da kann ich...
Bisher hat Intel keine solchen Pläne.