Abo
  • Services:

CPU-Architektur: Intels Skylake decodiert und rechnet mehr in einem Rutsch

Der Programmierleitfaden für Intels CPU-Architekturen zeigt: Die Skylake-Technik wurde im Frontend aufgebohrt, um mehr Befehle pro Takt zu den zusätzlichen Ausführungseinheiten zu schicken. Die Caches reagieren zwar langsamer, übertragen aber dann mehr Daten.

Artikel veröffentlicht am ,
Core i7-6700K mit Skylake-Architektur
Core i7-6700K mit Skylake-Architektur (Bild: Martin Wolf/Golem.de)

Intel hat seinen Programmierleitfaden für die hauseigenen CPU-Architekturen aktualisiert und um die Skylake-Technik erweitert (PDF). Dem Dokument zufolge hat Intel bei der neuen Architektur vor allem das Frontend überarbeitet und an der Geschwindigkeit der Caches gearbeitet, das Backend hingegen entspricht entgegen bisheriger Aussagen der Haswell-Architektur.

Stellenmarkt
  1. Information und Technik Nordrhein-Westfalen (IT.NRW), Düsseldorf
  2. STI - Gustav Stabernack GmbH, Lauterbach

Im Frontend sind wie gehabt vier Decoder verbaut, die herbeigeholte Instruktionen in Mikrobefehle umarbeiten. Anders als alle Core-Architekturen ab Haswell kann die Skylake-Technik allerdings fünf bis sechs statt vier Mikrobefehle (µOps) pro Taktzyklus decodieren. Wenn Intel jedoch von µOps spricht, sind damit teilweise verschmolzene Assembler-Befehle gemeint, die Intel Macro- statt Micro-Ops nennt und seit der Core-Architektur verwendet.

  • Blockdiagramm der Skylake-Architektur (Bild: Intel)
Blockdiagramm der Skylake-Architektur (Bild: Intel)

Die Caches, aus denen das Frontend seine Daten bezieht, hat Intel stark verbessert - das zeigte bereits unser Test. Die Dokumentation verrät, dass die höhere Geschwindigkeit nicht von ungefähr kommt: Zwar ist die Transferrate der Puffer massiv angestiegen, die Latenzen aber auch. Bis der L2-Puffer reagiert, dauert es bei Skylake im besten Fall 12 Taktzyklen, bei Haswell nur 11. Auch der L3-Cache braucht bei der Zugriffsdauer etwas länger als bei Haswell, hier sind es im besten Fall 44 statt 34 Zyklen.

Verglichen mit Haswell ergeben die flotteren Caches und das beschleunigte Frontend Sinn, da bei dieser Architektur die Anzahl der Scheduler-Ports und der angeschlossenen Funktionseinheiten erhöht wurde. Dazu zählte eine vierte Integer-ALU, die in dieser Form auch bei Skylake vorhanden ist - durch die schnellere Datenanlieferung bekommt das Rechenwerk nun mehr Arbeit ab. Das ist beispielsweise für Hyperthreading (SMT) interessant.

Mehr Ports oder Funktionseinheiten gibt es bei Skylake ebenfalls - ein Punkt, über den Intel bisher nicht sprechen wollte. Neu sind eine weitere Vector-Shift- und eine Multiplikationseinheit. Instruktionen wie (v)pmul sind allerdings für AVX-Berechnungen gedacht, wovon nur wenige Programme profitieren. Das ist bei vergleichsweise neuen Befehlssätzen allerdings üblich.



Anzeige
Blu-ray-Angebote
  1. 34,99€

Sharra 29. Okt 2015

3 Wochen, nachdem der Thread eigentlich schon ausgelutscht ist, diese Aussage zu bringen...

nille02 07. Okt 2015

Das hängt von der Qualität und der geforderten Geschwindigkeit ab. H265 und VP9 sind...


Folgen Sie uns
       


Sony Xperia XZ3 - Hands on (Ifa 2018)

Das neue Xperia XZ3 von Sony kommt mit Oberklasse-Hardware und interessanten Funktionen, die dem Nutzer den Alltag erleichtern können. Außerdem hat das Gerät einen OLED-Bildschirm, eine Premiere bei einem Smartphone von Sony.

Sony Xperia XZ3 - Hands on (Ifa 2018) Video aufrufen
Lenovo Thinkpad T480s im Test: Das trotzdem beste Business-Notebook
Lenovo Thinkpad T480s im Test
Das trotzdem beste Business-Notebook

Mit dem Thinkpad T480s verkauft Lenovo ein exzellentes 14-Zoll-Business-Notebook. Anschlüsse und Eingabegeräte überzeugen uns - leider ist aber die CPU konservativ eingestellt und ein gutes Display kostet extra.
Ein Test von Marc Sauter und Sebastian Grüner

  1. Thinkpad E480/E485 im Test AMD gegen Intel in Lenovos 14-Zoll-Notebook
  2. Lenovo Das Thinkpad P1 ist das X1 Carbon als Workstation
  3. Thinkpad Ultra Docking Station im Test Das USB-Typ-C-Dock mit robuster Mechanik

SpaceX: Milliardär will Künstler mit zum Mond nehmen
SpaceX
Milliardär will Künstler mit zum Mond nehmen

Ein japanischer Milliardär ist der mysteriöse erste Kunde von SpaceX, der um den Mond fliegen will. Er will eine Gruppe von Künstlern zu dem Flug einladen. Die Pläne für das Raumschiff stehen kurz vor der Fertigstellung.
Von Frank Wunderlich-Pfeiffer

  1. Mondwettbewerb Niemand gewinnt den Google Lunar X-Prize

Grafikkarten: Das kann Nvidias Turing-Architektur
Grafikkarten
Das kann Nvidias Turing-Architektur

Zwei Jahre nach Pascal folgt Turing: Die GPU-Architektur führt Tensor-Cores und RT-Kerne für Spieler ein. Die Geforce RTX haben mächtige Shader-Einheiten, große Caches sowie GDDR6-Videospeicher für Raytracing, für Deep-Learning-Kantenglättung und für mehr Leistung.
Ein Bericht von Marc Sauter

  1. Tesla T4 Nvidia bringt Googles Cloud auf Turing
  2. Battlefield 5 mit Raytracing Wenn sich der Gegner in unserem Rücken spiegelt
  3. Nvidia Turing Geforce RTX 2080 rechnet 50 Prozent schneller

    •  /