Abo
  • Services:
Anzeige
Core i7-6700K mit Skylake-Architektur
Core i7-6700K mit Skylake-Architektur (Bild: Martin Wolf/Golem.de)

CPU-Architektur: Intels Skylake decodiert und rechnet mehr in einem Rutsch

Core i7-6700K mit Skylake-Architektur
Core i7-6700K mit Skylake-Architektur (Bild: Martin Wolf/Golem.de)

Der Programmierleitfaden für Intels CPU-Architekturen zeigt: Die Skylake-Technik wurde im Frontend aufgebohrt, um mehr Befehle pro Takt zu den zusätzlichen Ausführungseinheiten zu schicken. Die Caches reagieren zwar langsamer, übertragen aber dann mehr Daten.

Anzeige

Intel hat seinen Programmierleitfaden für die hauseigenen CPU-Architekturen aktualisiert und um die Skylake-Technik erweitert (PDF). Dem Dokument zufolge hat Intel bei der neuen Architektur vor allem das Frontend überarbeitet und an der Geschwindigkeit der Caches gearbeitet, das Backend hingegen entspricht entgegen bisheriger Aussagen der Haswell-Architektur.

Im Frontend sind wie gehabt vier Decoder verbaut, die herbeigeholte Instruktionen in Mikrobefehle umarbeiten. Anders als alle Core-Architekturen ab Haswell kann die Skylake-Technik allerdings fünf bis sechs statt vier Mikrobefehle (µOps) pro Taktzyklus decodieren. Wenn Intel jedoch von µOps spricht, sind damit teilweise verschmolzene Assembler-Befehle gemeint, die Intel Macro- statt Micro-Ops nennt und seit der Core-Architektur verwendet.

  • Blockdiagramm der Skylake-Architektur (Bild: Intel)
Blockdiagramm der Skylake-Architektur (Bild: Intel)

Die Caches, aus denen das Frontend seine Daten bezieht, hat Intel stark verbessert - das zeigte bereits unser Test. Die Dokumentation verrät, dass die höhere Geschwindigkeit nicht von ungefähr kommt: Zwar ist die Transferrate der Puffer massiv angestiegen, die Latenzen aber auch. Bis der L2-Puffer reagiert, dauert es bei Skylake im besten Fall 12 Taktzyklen, bei Haswell nur 11. Auch der L3-Cache braucht bei der Zugriffsdauer etwas länger als bei Haswell, hier sind es im besten Fall 44 statt 34 Zyklen.

Verglichen mit Haswell ergeben die flotteren Caches und das beschleunigte Frontend Sinn, da bei dieser Architektur die Anzahl der Scheduler-Ports und der angeschlossenen Funktionseinheiten erhöht wurde. Dazu zählte eine vierte Integer-ALU, die in dieser Form auch bei Skylake vorhanden ist - durch die schnellere Datenanlieferung bekommt das Rechenwerk nun mehr Arbeit ab. Das ist beispielsweise für Hyperthreading (SMT) interessant.

Mehr Ports oder Funktionseinheiten gibt es bei Skylake ebenfalls - ein Punkt, über den Intel bisher nicht sprechen wollte. Neu sind eine weitere Vector-Shift- und eine Multiplikationseinheit. Instruktionen wie (v)pmul sind allerdings für AVX-Berechnungen gedacht, wovon nur wenige Programme profitieren. Das ist bei vergleichsweise neuen Befehlssätzen allerdings üblich.


eye home zur Startseite
Sharra 29. Okt 2015

3 Wochen, nachdem der Thread eigentlich schon ausgelutscht ist, diese Aussage zu bringen...

nille02 07. Okt 2015

Das hängt von der Qualität und der geforderten Geschwindigkeit ab. H265 und VP9 sind...



Anzeige

Stellenmarkt
  1. Syna GmbH, Frankfurt am Main
  2. MEMMERT GmbH + Co. KG, Schwabach (Metropolregion Nürnberg)
  3. TADANO FAUN GmbH, Lauf an der Pegnitz / bei Nürnberg
  4. Leopold Kostal GmbH & Co. KG, Hagen


Anzeige
Top-Angebote
  1. (u. a. Laptops, Werkzeuge, Outdoor-Spielzeug, Grills usw.)
  2. (u. a. Bose Soundlink Mini Bluetooth Speaker II 149,90€, Bose SOUNDSPORT PULSE WIRELESS 174,90€)

Folgen Sie uns
       


  1. ZTE

    Chinas großes 5G-Testprojekt läuft weiter

  2. Ubisoft

    Far Cry 5 bietet Kampf gegen Sekte in und über Montana

  3. Rockstar Games

    Waffenschiebereien in GTA 5

  4. Browser-Games

    Unreal Engine 4.16 unterstützt Wasm und WebGL 2.0

  5. Hasskommentare

    Bundesrat fordert zahlreiche Änderungen an Maas-Gesetz

  6. GVFS

    Windows-Team nutzt fast vollständig Git

  7. Netzneutralität

    Verbraucherschützer wollen Verbot von Stream On der Telekom

  8. Wahlprogramm

    SPD fordert Anzeigepflicht für "relevante Inhalte" im Netz

  9. Funkfrequenzen

    Bundesnetzagentur und Alibaba wollen Produkte sperren

  10. Elektromobilität

    Qualcomm lädt E-Autos während der Fahrt auf



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

XPS 13 (9365) im Test: Dells Convertible zeigt alte Stärken und neue Schwächen
XPS 13 (9365) im Test
Dells Convertible zeigt alte Stärken und neue Schwächen
  1. Schnittstelle Intel pflegt endlich Linux-Treiber für Thunderbolt
  2. Atom C2000 & Kaby Lake Updates beheben Defekt respektive fehlendes HDCP 2.2
  3. UP2718Q Dell verkauft HDR10-Monitor ab Mai 2017

Calliope Mini im Test: Neuland lernt programmieren
Calliope Mini im Test
Neuland lernt programmieren
  1. Arduino Cinque RISC-V-Prozessor und ESP32 auf einem Board vereint
  2. MKRFOX1200 Neues Arduino-Board erscheint mit kostenlosem Datentarif
  3. Creoqode 2048 Tragbare Spielekonsole zum Basteln erhältlich

  1. Re: gesamtwirtschaftlich gesehen günstiger...

    Squirrelchen | 06:16

  2. Re: Warum nicht früher?

    Crass Spektakel | 05:50

  3. Zu schnell

    Crass Spektakel | 05:43

  4. Wäre dies eine Energiesparlösung gegenüber einem...

    Signator | 03:56

  5. Re: 1400W... für welche Hardware?

    Ach | 03:47


  1. 17:40

  2. 16:40

  3. 16:29

  4. 16:27

  5. 15:15

  6. 13:35

  7. 13:17

  8. 13:05


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel