Zum Hauptinhalt Zur Navigation

Neue Architektur: Haswell mit neuem Frontend und einer neuen Marke

IDF
Intel hat in der Eröffnungskeynote des IDF wenig zur Technik im kommenden Haswell-Prozessor gesagt, am Nachmittag gab es zu dessen CPU-Teil noch etliche Details. Und eine Überraschung anderer Art.
/ Nico Ernst
10 Kommentare News folgen (öffnet im neuen Fenster)
Der CPU-Teil von Haswell im Überblick (Bild: Nico Ernst/Golem.de)
Der CPU-Teil von Haswell im Überblick Bild: Nico Ernst/Golem.de

Die schon vor dem IDF in San Francisco bestätigte 10-Watt-Variante von Haswell wird aller Wahrscheinlichkeit nach keine Core-CPU mehr sein. Das hat Intels PC-Chef Kirk Skaugen in seinem Vortrag nach der Keynote-Ansprache von David Perlmutter gesagt.

Natürlich basiert auch diese Version auf derselben Architektur wie alle Haswells, die bei Geräten von Servern bis zu Tablets eingesetzt werden sollen. Weil es sich jedoch um einen Prozessor speziell für Ultrabooks handelt, denkt Intel derzeit über eine neue Marke nach, die dann nach Atom und Core die dritte für PCs wäre. Golem.de hat Skaugen dafür in Anlehnung an Intels erste CPU-Wortmarke "Pentium" und an "Ultrabook" schon einmal die Bezeichnung "Ultium" vorgeschlagen, was der Manager lachend zur Kenntnis nahm.

Weniger Lachen war in einem weiteren Vortrag zu hören, als die Chefentwickler von Haswell in 45 Minuten durch 31 Folien mit Details der CPU-Architektur hetzten. Dem Grafikanteil und der Integration des Chipsatzes sind auf dem IDF noch weitere Vorträge gewidmet, Fragen etwa zum Polling von alten USB-Geräten und den Write-Back-Caches von SATA-Laufwerken – was im schlimmsten Fall den halben Prozessor aufwecken könnte – wurden nicht beantwortet.

Dafür gingen die Chipdesigner aber sehr ins Detail bei den Verbesserungen des CPU-Anteils von Haswell. Was viele mit Ivy Bridge erwartet hatten, nämlich eine Steigerung der Rechenleistung pro Takt (IPC), war bei Haswell eines der obersten Entwicklungsziele. Gleichzeitig sollte das neue Konzept auch sparsamer werden.

Neuer Schlafmodus C7 integriert

Um das zu erreichen, hat Intel vor allem das Frontend überarbeitet, die eigentliche Pipeline hat sich seit Sandy Bridge kaum verändert. Auffällig ist zunächst eine verdoppelte Bandbreite des L2-Caches, die dafür sorgt, dass der Cache nach dem Aufwecken eines CPU-Kerns viel schneller Daten bereitstellen kann. Die vielen Stromsparmechanismen müssen dabei weniger aufeinander warten, zudem können die C-States, also die Schlafzustände von Teilen der CPU, laut Intel nun 25 Prozent schneller gewechselt werden.

Zusätzlich gibt es einen neuen Schlafmodus namens C7 – bisher war C6 die tiefste Stufe – der auch "Active Idle" genannt wird. Die CPU soll dabei fast so wenig Leistung aufnehmen wie im Standby-Modus S3, aber viel schneller daraus aufwachen können. Am wichtigsten für das Stromsparen bei Haswell ist aber eine dritte Power-Domain für die GPU: Nun können sowohl die Cores, der Ringbus samt Last-Level-Cache (früher L3 genannt) als auch die Grafikeinheit voneinander unabhängig abgeschaltet werden.

Das erklärt auch, warum David Perlmutter einen Haswell-Prototyp demonstrieren konnte, der mit dem Benchmark Heaven nur 8 Watt Leistung aufnahm : Heaven erzeugt nur sehr geringe CPU-Last. Vor allem die GPU und der Speichercontroller – weil er ja die Zugriffe auf das Shared Memory steuern muss – dürften dabei aktiv gewesen sein, die CPU-Cores meistens nicht. Das war auch bei Ivy Bridge noch nicht möglich.

Für mehr Rechenleistung pro Takt soll bei Haswell vor allem ein überarbeitetes Frontend sorgen. Dabei stehen nun acht statt sechs Ports zu den Rechenwerken (Execution Units) zur Verfügung, deren Aufteilung zudem stark verändert wurde. Intels Idee ist, dass die Scheduler die Aufgaben immer so auf die Ports verteilen, dass diese möglichst kurz blockiert sind. So sind zum Beispiel die beiden Zugänge zu den Ports für " fused multiply add " (FMA) getrennt.

Mehr Geschwindigkeit für bisherige Software

FMA sorgt für das schnelle Addieren des Ergebnisses von Multiplikationen, wovon vor allem Medienanwendungen und Supercomputerprogramme, aber auch Spiele profitieren können. AMD unterstützt FMA seit der Bulldozer-Architektur , und da nun auch Intel dabei ist, dürften Programme schnell daran angepasst werden. Anders als bei Befehlssatzerweiterungen wie dem AVX2, das Haswell bietet, sind dafür wenig Eingriffe in den Code nötig. Oft reicht eine einfache Übersetzung mit neuen Compilern.

Auch ohne diesen Schritt können ältere Programme von anderen Verbesserungen am Frontend von Haswell profitieren. So sind unter anderem mehrere gleichzeitig nicht aufgelöste Cache-Misses möglich, was eine bessere Sprungvorhersage (Branch Prediction) verspricht. Das gesamte Frontend kann spekulativer arbeiten, auch weil die Bandbreite zum L2-Cache gesteigert wurde. Ebenso wurden die Zugriffe auf Befehle und Ergebnisse entflochten, Haswell beherrscht zwei Loads und einen Store pro Takt. Das ungleiche Verhältnis ist der spekulativeren Auslegung geschuldet.

Wie viel mehr Rechenleistung Haswell insgesamt aus all diesen Änderungen ziehen kann, behält Intel auch auf mehrfaches Nachfragen noch für sich. Auch die Spekulationen von Softwareentwicklern und Journalisten gehen hier weit auseinander: Mal sollen es 20 Prozent sein, mal nur 10, wie auf dem IDF zu hören ist. Als sehr wahrscheinlich gilt, dass Haswell mit allen Anwendungen – auch älteren Programmen – deutlich schneller wird, und bei Neukompilierungen und vollständig angepasstem Code mit AVX sogar bis zu doppelt so schnell wie Ivy Bridge rechnen kann.

Das hängt aber auch davon ab, wie weit Intel über den Takt die Leistungsaufnahme drücken will. Bei Ultrabooks steht, auch durch fehlende Konkurrenz, die Akkulaufzeit im Vordergrund, und bei Desktop-PCs und Servern gibt es mehr Spielraum. Sofern dort durch einfachere Kühlsysteme nicht auch die Preise für die Gesamtsysteme gesenkt werden sollen, könnte Haswell aber viele der Erwartungen erfüllen, die schon mit Ivy Bridge und seinen 22-Nanometer-Strukturen geweckt wurden.


Relevante Themen