Abo
  • Services:
Anzeige
Blockdiagramm zur Gen9-Grafikeinheit
Blockdiagramm zur Gen9-Grafikeinheit (Bild: Intel)

Überarbeitete Caches treffen dickere Buffer

Ein erster Blick auf den von Intel zur Verfügung gestellten Die-Shot zeigt eines sehr schön: Selbst ohne Kennwerte wie Transistoranzahl und Chipfläche wird klar, dass Intel die Anordnung der CPU-Kerne umgestellt hat. Statt bis zu vier nebeneinander zu setzen, befindet sich der L3-Cache zwischen zwei Kern-Pärchen und diese sind weitaus größer als bisher. Die Caches selbst fassen jedoch weiterhin die gleiche Menge an Daten, eine Vergrößerung würde unverhältnismäßig viele zusätzliche Transistoren kosten.

Anzeige

Beginnen wir jedoch vorne bei den einzelnen Bestandteilen eines CPU-Kerns: Die Sprungvorhersage im Frontend verfügt über mehr Einträge und soll genauer arbeiten, die Prefetch-Stufe Daten flotter in die Caches schieben. Am Micro-Operationen-Cache (µOPs) hat Intel offenbar nichts geändert, er dürfte weiterhin 1.500 Einträge fassen. Buffer wie das Out-of-Order-Fenster sichern hingegen weitaus mehr Daten, womit die dahinter gelagerten Funktionseinheiten entweder schneller und mehr davon parallel gefüttert oder schlicht früher abgeschaltet werden können. Das spart Energie und verringert die Temperatur, was wiederum einen höheren und längeren Turbo-Takt unter Last ermöglicht.

  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
Details zur Skylake-Architektur (Bild: Intel)

Was Intel bisher nicht verraten hat, ist der genaue Aufbau der Ausführungseinheiten. Der Scheduler oder auch Reservation Station, welcher die einzelnen Dispatch-Ports mit ihren Gleitkomma- (FP) und Integer-Rechenwerken sowie die Lade- und Speichereinheiten ansteuert, kann zwar mehr Einträge aufnehmen und verteilen, damit Hyperthreading schneller arbeitet (kein Reverse HT!). In der Tat liegt ein Skylake-Chip wie der Core i7-6700K bei vielen Threads pro Takt weiter vor Haswell, als wenn nur ein Thread abgearbeitet wird.

Unklar bleibt aber vorerst, ob Intel beispielsweise die Anzahl der an den Scheduler angeschlossenen Ports und die daran hängenden Ausführungseinheiten erhöht hat. Bei Haswell erweiterte der Hersteller die Ports von sechs auf acht und verbaute unter anderem eine weitere Integer-ALU. Eine Präsentation mit Angaben zur Port-Anzahl von Skylake haben wir zwar gefunden, aber auch dort lässt sich Intel nicht in die Karten schauen und spricht lapidar von mehr als drei statt konkret acht oder mehr zu benennen.

  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
Details zur Skylake-Architektur (Bild: Intel)

Julius Mandelblat zufolge stecken in jedem Skylake-Kern mehr Ausführungseinheiten, deren Latenzen zudem verglichen mit Haswell verringert worden sein sollen. Eine interessante Verbesserung ist eine dedizierte Power-Gate-Funktion für die AVX2-Einheiten: Die meisten Anwendungen nutzen diese entweder exzessiv (weshalb Intel hier den Takt reduziert) oder gar nicht. In letzterem Fall werden sie von der Stromversorgung getrennt (Power Gating), damit keine Leckströme die Leistungsaufnahme des Chips erhöhen.

Die L1-Daten- und Instruktionen-Caches sichern je 32 KByte, der L2-Cache pro Kern speichert 1.024 KByte. Seine Assoziativität wurde aus Stromspargründen von acht auf vier halbiert, kompensiert wird das aber durch Verbesserungen an anderer Stelle - dazu gleich mehr. Der L3-Cache, gerne von Intel unsinnigerweise als LLC (Last-Level-Cache) bezeichnet, ist je nach Chip physikalisch vier oder acht MByte groß und wird von allen Kernen gemeinsam verwendet. Unsere Messungen zeigen, dass die L1-Caches von Skylake verglichen mit Haswell pro Takt nicht schneller wurden, sehr wohl aber die zweite und dritte Cache-Stufe.

  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
  • Details zur Skylake-Architektur (Bild: Intel)
Details zur Skylake-Architektur (Bild: Intel)

Da deren Geschwindigkeit an die CPU-Frequenz gekoppelt ist, muss die teils verdoppelte Bandbreite woanders herkommen. Intel gibt an, den Fabric-Durchsatz zwischen dem L2- und dem L3-Cache um den Faktor zwei gesteigert zu haben. Sollte ein Cache Miss auftreten - die erwünschten Daten werden also nicht im durchsuchten Puffer gefunden - kann Skylake deutlich flotter weiterarbeiten. Gleiches gilt für einen Page Miss in einigen nicht näher benannten TLBs (Translation Lookaside Buffer), vermutlich für die des L1 und L2.

All die vergrößerten Buffer und beschleunigten Cache-Funktionen füttern bei Skylake also mehr Ausführungseinheiten schneller mit Daten. Somit lastet Intel die CPU-Kerne besser aus und steigert die Geschwindigkeit pro Takt messbar. Wir erwarten in den kommenden Monaten detaillierte Informationen.

Deutlich offener gestaltete Intel die Datenlage zur Grafikeinheit, hielt sich aber auch hier in einigen Teilbereichen etwas zurück.

 Architektur erklärt: Intel spricht wenig bis viel über SkylakeDrei statt zwei Grafik-Slices mit mehr Tricks 

eye home zur Startseite
kvoram 21. Aug 2015

Deien Vermutung, das es einfach mit einer ausreichend starken CPU kein Problem ist, ist...

Maximilian154 21. Aug 2015

Ich fand sie passend. Ist wohl bereits obligatorisch geworden sich hier über die...

Misanthrop 20. Aug 2015

Gibbet denn keine asics für beste qualität und fertig ... mehr will doch keiner ? Und...

andi_lala 20. Aug 2015

Auch wenn es nur 64MB sind klingt das mal schon ganz gut und interessant. Da dürften die...

eliasp 20. Aug 2015

Wird vom Linux-Kernel seit 3.20 unterstützt: http://lkml.iu.edu/hypermail/linux/kernel...



Anzeige

Stellenmarkt
  1. DATAGROUP Köln GmbH, Berlin, Dessau
  2. Fresenius Netcare GmbH, Bad Homburg
  3. medavis GmbH, Karlsruhe
  4. Universitätsmedizin der Johannes Gutenberg-Universität Mainz, Mainz


Anzeige
Blu-ray-Angebote
  1. (u. a. Die große Bud Spencer-Box Blu-ray 16,97€, Club der roten Bänder 1. Staffel Blu-ray 14...
  2. (u. a. Interstellar, Maze Runner, Kingsman, 96 Hours)
  3. (u. a. The Complete Bourne Collection Blu-ray 14,99€, Harry Potter Complete Blu-ray 44,99€)

Folgen Sie uns
       


  1. Red Star OS

    Sicherheitslücke in Nordkoreas Staats-Linux

  2. Elektroauto

    Porsche will 20.000 Elektrosportwagen pro Jahr verkaufen

  3. TV-Kabelnetz

    Tele Columbus will Marken abschaffen

  4. Barrierefreiheit

    Microsofts KI hilft Blinden in Office

  5. AdvanceTV

    Tele Columbus führt neue Set-Top-Box für 4K vor

  6. Oculus Touch im Test

    Tolle Tracking-Controller für begrenzte Roomscale-Erfahrung

  7. 3D Xpoint

    Intels Optane-SSDs erscheinen nicht mehr 2016

  8. Webprogrammierung

    PHP 7.1 erweitert Nullen und das Nichts

  9. VSS Unity

    Virgin Galactic testet neues Raketenflugzeug

  10. Google, Apple und Mailaccounts

    Zwei-Faktor-Authentifizierung richtig nutzen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Robot Operating System: Was Bratwurst-Bot und autonome Autos gemeinsam haben
Robot Operating System
Was Bratwurst-Bot und autonome Autos gemeinsam haben
  1. Roboterarm Dobot M1 - der Industrieroboter für daheim
  2. Roboter Laundroid faltet die Wäsche
  3. Fahrbare Roboter Japanische Firmen arbeiten an Transformers

Super Mario Bros. (1985): Fahrt ab auf den Bruder!
Super Mario Bros. (1985)
Fahrt ab auf den Bruder!
  1. Quake (1996) Urknall für Mouselook, Mods und moderne 3D-Grafik
  2. NES Classic Mini im Vergleichstest Technischer K.o.-Sieg für die Original-Hardware

HPE: Was The Machine ist und was nicht
HPE
Was The Machine ist und was nicht
  1. IaaS und PaaS Suse bekommt Cloudtechnik von HPE und wird Lieblings-Linux
  2. Memory-Driven Computing HPE zeigt Prototyp von The Machine
  3. Micro Focus HP Enterprise verkauft Software für 2,5 Milliarden Dollar

  1. Onlinedating

    TC | 21:36

  2. Re: Habe mich noch heute morgen gegen einen...

    grslbr | 21:32

  3. Re: Übrigens auch bei Windows 10

    xmaniac | 21:29

  4. Re: Betrifft nur wenige

    grslbr | 21:28

  5. Re: Henne-Ei-Problem?

    robinx999 | 21:27


  1. 17:25

  2. 17:06

  3. 16:53

  4. 16:15

  5. 16:02

  6. 16:00

  7. 15:00

  8. 14:14


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel