Abo
  • Services:

Kleinere Verbesserung an den x86-Kernen, aber FMA und AVX2

Es ist ein offenes Geheimnis, dass Intel seit dem von Grund auf neu entwickelten, ersten Core-i-Prozessor, Codename Nehalem, an den CPU-Kernen kaum Verbesserungen vorgenommen hat. Die höchste Leistung pro Takt (IPC) hat das Unternehmen im Vergleich zu AMD schon länger, nur bei der Grafik galt es noch viel aufzuholen.

Stellenmarkt
  1. SARTORIUS Werkzeuge GmbH & Co. KG, Ratingen
  2. Lidl Digital, Leingarten

Dennoch haben es sich die Entwickler zum Ziel gesetzt, die IPC-Leistung bei jeder Generation um rund 10 bis 15 Prozent - je nach Anwendung - in die Höhe zu schrauben. Vor allem beim Vergleich über zwei Tocks hinweg ergibt das etwas deutlichere Leistungssteigerungen. So ist in der Theorie bei gleichem Takt ein Core-i-4000 (Haswell) 20 bis 30 Prozent schneller als ein Core-i-2000 (Sandy Bridge). Die alte Faustregel, alle zwei Jahre seinen Rechner aufzurüsten, gilt also immer noch.

  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • Auch mit einem älteren Netzteil, hier 850 Watt, ist Haswell noch sparsamer.
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • Be Quiets Erklärung zu Netzteilen für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Liste kompatibler Netzteile von Cooler Master
  • Die Animation von PNGs mit Power Director per AVX lastet alle Kerne aus.
  • Power Director beim WMV-Transkodieren nutzt nur vier Kerne, und nicht einmal ganz.
  • 75 mal schneller - aber nur mit 3DMark06
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Intel erklärt die Neuerungen bei Haswell.
  • Zwei neue Ports
  • Intel erklärt die Neuerungen bei Haswell.
  • Der neue Spannungswandler
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Das Die von Haswell mit den Funktionseinheiten - nach aktuellsten Angaben besteht es aus 1,6 nicht 1,4 Milliarden Transistoren.
  • Für Ultrabooks können CPU mit GPU und Chipsatz auf einem Package sitzen.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Lightroom 3.5 lastet auch mit Haswell die Kerne nur sporadisch aus.
  • Zwei Dies von Haswell-CPUs auf einem Wafer.
  • Wafer mit Haswell-Dies
  • Blockdiagramm des Chipsatzes Z87 - die vielen USB-3-Ports kommen durch Hubs zustande.
Zwei neue Ports

Die größte Neuerung der Kerne von Haswell steckt in der Befehlssatzerweiterung "Advanced Vector Extensions 2" (AVX2) und der Unterstützung von "fused multiply add" (FMA). Bei letzterem können die Ergebnisse von Multiplikationen in einem Rutsch addiert werden, was vor allem bei 3D-Modellen oder Matrizenoperationen hilfreich ist. AVX2 ist eine Weiterentwicklung der SIMD-Verarbeitung, die bei Intel SSE heißt. Gegenüber 128 Bit breiten Daten wie bei Nehalem können Sandy Bridge, Ivy Bridge und nun auch Haswell mit 256 Bit breiten Vektoren umgehen. Die Neuerung bei Haswell: die AVX-Einheiten sind doppelt so schnell geworden.

Statt 16 Rechenoperationen pro Takt wie noch bei Sandy Bridge kann Haswell 32 Flops ausführen, jedenfalls bei einfacher Genauigkeit. Ist Double-Precision gefragt, sind es 16 statt 8 Flops. Auf dem Papier ergibt sich so bei gleichem Takt die doppelte Leistung bei AVX-Befehlen, aber: Wie bei allen Befehlssatzerweiterungen müssen Programme das unterstützen. Dies könnte in diesem Fall aber schneller passieren als bei früheren Erweiterungen wie MMX und SSE, da auch AMD seit den Bulldozer-Kernen AVX anbietet.

Damit FMA und AVX2 ihre höhere Leistung in den Rechenwerken erreichen, hat Intel vor allem durch Änderungen am Frontend die Bandbreite innerhalb des Prozessors erhöht. Die Bandbreite für das Laden und Speichern (Load/Store) ist gegenüber Ivy Bridge 64 bzw. 32 Byte pro Takt verdoppelt worden, Gleiches gilt für den L2-Cache, der nun mit 64 Byte statt vorher 32 Byte pro Takt vom L1-Cache angesprochen werden kann.

Eine weitere Erweiterung, die Befehle schneller ans Ziel kommen lässt, ist die Erhöhung der Dispatch-Ports von sechs auf acht. Die beiden neuen Zugänge zu den Ausführungseinheiten kümmern sich dabei um eine ALU-Einheit und die Sprungvorhersage (Port 6) und um das Speichern (Port 7). Die restliche Zuordnung ist einem Bild in der Galerie zu diesem Artikel zu entnehmen.

Damit die höhere Bandbreite bei den schon seit vielen Generationen asynchron arbeitenden Prozessoren quer über das Die aufrechterhalten werden kann, haben die Entwickler zusätzlich die Größe der Buffer erhöht. So können beispielsweise mit Haswell 192 Befehle im Out-of-Order-Verfahren umsortiert werden, sie werden abseits von den Caches in einem Buffer gespeichert. Bei Sandy Bridge waren es nur 168 Befehle.

 Schnellste Grafik vor allem für NotebooksIntegrierter Spannungswandler und neue Anforderungen an Netzteile 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14.  


Anzeige
Hardware-Angebote
  1. ab 499€

Anonymer Nutzer 04. Jun 2013

Dann lach du mal sinnfrei rum. Ist mir total schnuppe. Eine "aktuelle NVIDIA oder AMD...

narfomat 04. Jun 2013

ich hoffe durch diesen marketing bullshit werden alle glauben haswell ist das absolute...

caddy77 04. Jun 2013

3dcenter.org . Die haben eine Zusammenfassung von fast 20 Haswell Reviews ausgewertet!

Anonymer Nutzer 04. Jun 2013

Und ich als Linuxer freu mich über die brauchbare Spielegrafik mit Open Source Treiber...

cicero 04. Jun 2013

. Je kleiner die Struktur, je mehr Transistoren, je höher die Komplexität und die...


Folgen Sie uns
       


Subdomain Takeover - Interview mit Moritz Tremmel

Golem.de Redakteur Moritz Tremmel erklärt im Interview die Gefahren der Übernahme von Subdomains.

Subdomain Takeover - Interview mit Moritz Tremmel Video aufrufen
Russische Agenten angeklagt: Mit Bitcoin und CCleaner gegen Hillary Clinton
Russische Agenten angeklagt
Mit Bitcoin und CCleaner gegen Hillary Clinton

Die US-Justiz hat zwölf russische Agenten wegen des Hacks im US-Präsidentschaftswahlkampf angeklagt. Die Anklageschrift nennt viele technische Details und erhebt auch Vorwürfe gegen das Enthüllungsportal Wikileaks.

  1. Fancy Bear Microsoft verhindert neue Phishing-Angriffe auf US-Politiker
  2. Nach Gipfeltreffen Trump glaubt Putin mehr als US-Geheimdiensten
  3. US Space Force Planlos im Weltraum

Automatisiertes Fahren: Der schwierige Weg in den selbstfahrenden Stau
Automatisiertes Fahren
Der schwierige Weg in den selbstfahrenden Stau

Der Staupilot im neuen Audi A8 soll der erste Schritt auf dem Weg zum hochautomatisierten Fahren sein. Doch die Verhandlungen darüber, was solche Autos können müssen, sind sehr kompliziert. Und die Tests stellen Audi vor große Herausforderungen.
Ein Bericht von Friedhelm Greis

  1. Autonomes Fahren Ford will lieber langsam sein
  2. Navya Mainz testet autonomen Bus am Rheinufer
  3. Drive-by-wire Schaeffler kauft Lenktechnik für autonomes Fahren

Always Connected PCs im Test: Das kann Windows 10 on Snapdragon
Always Connected PCs im Test
Das kann Windows 10 on Snapdragon

Noch keine Konkurrenz für x86-Notebooks: Die Convertibles mit Snapdragon-Chip und Windows 10 on ARM sind flott, haben LTE integriert und eine extrem lange Akkulaufzeit. Der App- und der Treiber-Support ist im Alltag teils ein Manko, aber nur eins der bisherigen Geräte überzeugt uns.
Ein Test von Marc Sauter und Oliver Nickel

  1. Miix 630 Lenovos ARM-Detachable kostet 1.000 Euro
  2. Qualcomm "Wir entwickeln dediziertes Silizium für Laptops"
  3. Windows 10 on ARM Microsoft plant 64-Bit-Support ab Mai 2018

    •  /