CPU-Architektur: Intels Skylake decodiert und rechnet mehr in einem Rutsch

Der Programmierleitfaden für Intels CPU-Architekturen zeigt: Die Skylake-Technik wurde im Frontend aufgebohrt, um mehr Befehle pro Takt zu den zusätzlichen Ausführungseinheiten zu schicken. Die Caches reagieren zwar langsamer, übertragen aber dann mehr Daten.

Artikel veröffentlicht am ,
Core i7-6700K mit Skylake-Architektur
Core i7-6700K mit Skylake-Architektur (Bild: Martin Wolf/Golem.de)

Intel hat seinen Programmierleitfaden für die hauseigenen CPU-Architekturen aktualisiert und um die Skylake-Technik erweitert (PDF). Dem Dokument zufolge hat Intel bei der neuen Architektur vor allem das Frontend überarbeitet und an der Geschwindigkeit der Caches gearbeitet, das Backend hingegen entspricht entgegen bisheriger Aussagen der Haswell-Architektur.

Stellenmarkt
  1. IT Mitarbeiter (m/w/d) im 1st Level Support
    Grünecker Patent- und Rechtsanwälte, München
  2. Full Stack Web Developer (w/m/d)
    Personalwerk GmbH, Karben
Detailsuche

Im Frontend sind wie gehabt vier Decoder verbaut, die herbeigeholte Instruktionen in Mikrobefehle umarbeiten. Anders als alle Core-Architekturen ab Haswell kann die Skylake-Technik allerdings fünf bis sechs statt vier Mikrobefehle (µOps) pro Taktzyklus decodieren. Wenn Intel jedoch von µOps spricht, sind damit teilweise verschmolzene Assembler-Befehle gemeint, die Intel Macro- statt Micro-Ops nennt und seit der Core-Architektur verwendet.

  • Blockdiagramm der Skylake-Architektur (Bild: Intel)
Blockdiagramm der Skylake-Architektur (Bild: Intel)

Die Caches, aus denen das Frontend seine Daten bezieht, hat Intel stark verbessert - das zeigte bereits unser Test. Die Dokumentation verrät, dass die höhere Geschwindigkeit nicht von ungefähr kommt: Zwar ist die Transferrate der Puffer massiv angestiegen, die Latenzen aber auch. Bis der L2-Puffer reagiert, dauert es bei Skylake im besten Fall 12 Taktzyklen, bei Haswell nur 11. Auch der L3-Cache braucht bei der Zugriffsdauer etwas länger als bei Haswell, hier sind es im besten Fall 44 statt 34 Zyklen.

Verglichen mit Haswell ergeben die flotteren Caches und das beschleunigte Frontend Sinn, da bei dieser Architektur die Anzahl der Scheduler-Ports und der angeschlossenen Funktionseinheiten erhöht wurde. Dazu zählte eine vierte Integer-ALU, die in dieser Form auch bei Skylake vorhanden ist - durch die schnellere Datenanlieferung bekommt das Rechenwerk nun mehr Arbeit ab. Das ist beispielsweise für Hyperthreading (SMT) interessant.

Golem Karrierewelt
  1. Adobe Premiere Pro Grundkurs: virtueller Zwei-Tage-Workshop
    02./03.08.2022, Virtuell
  2. Deep-Dive Kubernetes – Observability, Monitoring & Alerting: virtueller Ein-Tages-Workshop
    22.09.2022, Virtuell
Weitere IT-Trainings

Mehr Ports oder Funktionseinheiten gibt es bei Skylake ebenfalls - ein Punkt, über den Intel bisher nicht sprechen wollte. Neu sind eine weitere Vector-Shift- und eine Multiplikationseinheit. Instruktionen wie (v)pmul sind allerdings für AVX-Berechnungen gedacht, wovon nur wenige Programme profitieren. Das ist bei vergleichsweise neuen Befehlssätzen allerdings üblich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Sharra 29. Okt 2015

3 Wochen, nachdem der Thread eigentlich schon ausgelutscht ist, diese Aussage zu bringen...

nille02 07. Okt 2015

Das hängt von der Qualität und der geforderten Geschwindigkeit ab. H265 und VP9 sind...



Aktuell auf der Startseite von Golem.de
US-Streaming
Abonnenten immer unzufriedener mit Netflix

Wenn Netflix-Abonnenten das Abo kündigen, wird vor allem der hohe Preis sowie ein schlechtes Preis-Leistungs-Verhältnis als Grund dafür genannt.

US-Streaming: Abonnenten immer unzufriedener mit Netflix
Artikel
  1. Covid-19-Fälle: Homeoffice bleibt bei Apple die Regel
    Covid-19-Fälle
    Homeoffice bleibt bei Apple die Regel

    Apple kann die Rückkehr ins Büro nicht wie geplant durchführen. Die Coronapandemie verhindert drei Tage Mindestanwesenheit.

  2. Elektro-SUV: Drako Dragon soll Teslas Model X Plaid deutlich übertreffen
    Elektro-SUV
    Drako Dragon soll Teslas Model X Plaid deutlich übertreffen

    Das Elektroauto Drako Dragon soll mit seinen vier Motoren eine Leistung von 1.470 kW entwickeln und 320 km/h Spitze fahren.

  3. Evari 856: Minimalistisches E-Bike mit Monocoque-Rahmen und Titan
    Evari 856
    Minimalistisches E-Bike mit Monocoque-Rahmen und Titan

    Evari 856 heißt das E-Bike, das mit einem Monocoque-Rahmen aus Carbon ausgestattet ist. Dadurch soll es besonders leicht und stabil sein.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI RTX 3080 Ti Ventus 3X 12G OC 1.049€ • Alternate (u. a. Corsair Vengeance LPX 32 GB DDR4-3600 106,89€) • be quiet! Pure Rock 2 26,99€ • SanDisk microSDXC 400 GB 29€ • The Quarry + PS5-Controller 99,99€ • Samsung Galaxy Watch 3 119€ • Top-PC mit Ryzen 7 & RTX 3070 Ti 1.700€ [Werbung]
    •  /