Intels Core-Architektur im Detail

Anzeige

Wide Dynamic Execution

Die Core-Architektur zählt zur Klasse der "Spaghetti-Code-Optimierer". Schon seit dem Pentium werden bei der betagten x86-Architektur nicht mehr die Assembler-Befehle direkt und der Reihe nach ausgeführt. Stattdessen übersetzen die CPUs diese bei Intel "Macro-Ops" genannten Befehle in kleinere Einheiten namens "Micro-Ops". Diese Micro-Ops arbeitet der Prozessor dann in einer anderen Reihenfolge ab ("out-of-order execution") und handelt dabei auch in vorauseilendem Gehorsam, der "speculative execution". Ist das Ergebnis einer spekulativen Berechnung richtig, wird das Resultat direkt übertragen, falls nicht, wird neu gerechnet.

Vierfach skalar
Vierfach skalar
Vier der eigentlichen Maschinencode-Befehle kann Core in einem Takt verarbeiten, er arbeitet also vierfach skalar gegenüber dreifacher Skalarität beim Pentium 4 und Pentium M. Die Pipeline wurde gegenüber dem letzten Pentium-4-Design "Prescott" von 31 auf 14 Stufen drastisch verkürzt. Gerade die lange Pipe des Prescott wird dafür verantwortlich gemacht, dass der Pentium 4 mit immer höherem Takt kaum noch an Leistung gewinnt. Bei einer langen Pipe ist der Zeitverlust umso größer, wenn eine spekulative Ausführung fehlgeschlagen ist oder eine Sprungvorhersage ("branch prediction") ein fehlerhaftes Ergebnis hatte - die Pipe muss im schlimmsten Fall komplett neu gefüllt werden.

Core kann quer durch einen Prozessorkern gleichzeitig 96 Micro-Ops "in flight" halten, also spekulativ ausführen. Beim Prescott waren es noch 126 Befehle "in flight", in Verbindung mit der kürzeren Pipe ist Core aber deutlich effizienter.

Fusionsprinzipien
Fusionsprinzipien
Ein Ziel der Core-Architektur war auch diese Takt-Effizienz: Mit jedem Zyklus sollen so viele Befehle wie möglich ausgeführt werden. Ein erster Schritt dazu war die bereits mit dem ersten Pentium M "Banias" eingeführte "Micro-Ops-Fusion": Häufig auftretende Abfolgen von Micro-Ops wurden durch eine neue Micro-Op ersetzt. Intel-Mitarbeiter erklären das Konzept oft anhand von Alltagsaufgaben - da wollen wir nicht nachstehen: Man stelle sich zum Beispiel vor, was man morgens vor dem Weg zur Arbeit alles tun muss, etwa Zähneputzen und duschen. Diese Vorgänge kann man nun in einzelne Schritte aufteilen, wenn man sie jemand genau beschreiben will, etwa Zähne putzen: Bürste befeuchten, Tube aufschrauben, Zahnpasta auftragen, Tube verschließen, putzen, spülen. Diese Schritte seien das Beispiel für die Micro-Ops. Da man diese Aktionen immer ausführen muss, wenn man sich die Zähne putzt, kann man die Anweisung auch akbürzen: Putze Dir die Zähne. Das wäre dann die neue Micro-Op für den gesamten Vorgang.

Macro-Ops-Fusion
Macro-Ops-Fusion
In Core kommt dazu noch das Konzept der "Macro-Ops-Fusion", bei der bestimmte Abfolgen von echten Assembler-Befehlen in eine Micro-Op zusammengefasst werden. In unserem Beispiel wären die beiden getrennten Vorgänge "Zähneputzen" und "Duschen", die idealerweise jeden Morgen ausgeführt werden sollten und immer die gleichen Schritte erfordern (gleiche Micro-Ops), dann mit der Anweisung: "Gehe Zähneputzen und Duschen" in eine Micro-Op zusammenzufassen.

Aus dem nassen Bad wieder zur trockenen Prozessormaterie: Bei x86-Code folgt auf den Befehl "Compare" (CMP) meistens ein Sprung mittels "Jump" (JMP). Diese beiden Macro-Ops hat Intel bei Core nun in eine Micro-Op zusammengefasst, so dass sie in einem Takt gemeinsam ausgeführt werden können. Andere Beispiele nannte Intel nicht, die müssen die Programmierer wohl anhand der endgültigen Produkte herausfinden - oder beim endgültigen Erscheinen der CPUs im Datenblatt nachlesen.

Das Konzept der "Wide Dynamic Execution" erfordert in den Core-Prozessoren eine Vielzahl an schnellen Zwischenspeichern ("Buffers"), über die sich Intel ebenfalls noch ausschweigt.

 Intels Core-Architektur im DetailIntels Core-Architektur im Detail 

HotShot 27. Mär 2006

Nix, weil er kein x86 kann. Daher für uns wertlos. Embedded Systeme wie die PS3 sind...

CPUhabenWoller 22. Mär 2006

Danke! Wie gesagt: Wäre aber ein Traum. Bei Asrock (IIRC) zum Beispiel gibt es aber MBs...

DoomWarrior 19. Mär 2006

Das wird aber dadurch relativiert, das Intel auch für jeden Speichertyp einen anderen...

:-) 18. Mär 2006

Da die Diskussion schon beendet ist, noch ein kleiner Nachtrag, der einen ganz anderen...

Suomynona 18. Mär 2006

Der Mainboard-Hersteller braucht ein Datenblatt mit physichen Kenngroessen, der Software...

Kommentieren




Anzeige

  1. Berater für ERP-Software (m/w)
    MACH AG, Berlin, Lübeck, Düsseldorf, München
  2. (Junior) Softwareentwickler/-in .NET
    FORUM MEDIA GROUP GMBH, Merching
  3. Sachbearbeiter/-in - Kommunikation, Marketing und Öffentlichkeitsarbeit
    IT.Niedersachsen, Hannover
  4. Senior Service Manager Outsourced Operations Management (m/w)
    Daimler AG, Stuttgart

 

Detailsuche


Folgen Sie uns
       


  1. CoreOS Stable Channel

    Ein minimales Betriebssystem für Docker

  2. 100 KBit/s statt 100 MBit/s

    Kabel Deutschland wegen Filmsharing-Drosselung verurteilt

  3. LG Tapbook

    Das Android-Convertible mit Ultrabook-Hardware

  4. Webmail

    Web.de kritisiert langsame De-Mail-Einführung der Regierung

  5. Akku

    US-Forscher entwickeln Akku mit Lithium-Anode

  6. Betriebssysteme

    Fehler im Linux-Kernel wegen GCC

  7. Microsoft

    Die Siedler von Catan als HTML5-Demo

  8. 25GE

    Ethernet mit 25 GBit/s pro Link wird zum Standard

  9. Swell

    Apple will Pandora-Konkurrenten kaufen und schließen

  10. Windows Phone 8.1

    Update soll Ordner und Case-Unterstützung bringen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Überwachungssoftware: Ein warmes Mittagessen für den Staatstrojaner
Überwachungssoftware
Ein warmes Mittagessen für den Staatstrojaner
  1. Ex-CIA-Deutschlandchef Wir konnten Schröder leider nicht abhören
  2. Überwachung NSA-Ausschuss erwägt Einsatz mechanischer Schreibmaschinen
  3. Kontrollausschuss Die Angst der Abgeordneten, abgehört zu werden

Smartphone-Hersteller Xiaomi: Wie Apple, nur anders
Smartphone-Hersteller Xiaomi
Wie Apple, nur anders
  1. Flir One Wärmebildkamera fürs iPhone lieferbar
  2. Per Smartphone Paypal ermöglicht Bezahlen in Restaurants landesweit
  3. Datenübertragung Smartphone-Kompass spielt Musik durch Magnetkraft

Nvidia Shield Tablet ausprobiert: Schnelles Spiele-Tablet für Android mit WLAN-Controller
Nvidia Shield Tablet ausprobiert
Schnelles Spiele-Tablet für Android mit WLAN-Controller
  1. Tegra K1 Start von Nvidias Shield Tablet zeichnet sich ab
  2. GM200 und GM204 Nvidias große Maxwell-GPUs zeigen sich beim Zoll
  3. Dual-GPU-Grafikkarte EVGA macht Titan-Z schmaler und leiser als Nvidia

    •  / 
    Zum Artikel