Kleinere Verbesserung an den x86-Kernen, aber FMA und AVX2

Es ist ein offenes Geheimnis, dass Intel seit dem von Grund auf neu entwickelten, ersten Core-i-Prozessor, Codename Nehalem, an den CPU-Kernen kaum Verbesserungen vorgenommen hat. Die höchste Leistung pro Takt (IPC) hat das Unternehmen im Vergleich zu AMD schon länger, nur bei der Grafik galt es noch viel aufzuholen.

Stellenmarkt
  1. SAP Treasury Consultant / Business Analyst (m/w/d)
    Allianz Technology SE, Stuttgart
  2. Produktberater (m/w/d) Personal-Software
    Stiftung Kirchliches Rechenzentrum Südwestdeutschland, Eggenstein-Leopoldshafen
Detailsuche

Dennoch haben es sich die Entwickler zum Ziel gesetzt, die IPC-Leistung bei jeder Generation um rund 10 bis 15 Prozent - je nach Anwendung - in die Höhe zu schrauben. Vor allem beim Vergleich über zwei Tocks hinweg ergibt das etwas deutlichere Leistungssteigerungen. So ist in der Theorie bei gleichem Takt ein Core-i-4000 (Haswell) 20 bis 30 Prozent schneller als ein Core-i-2000 (Sandy Bridge). Die alte Faustregel, alle zwei Jahre seinen Rechner aufzurüsten, gilt also immer noch.

  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • Auch mit einem älteren Netzteil, hier 850 Watt, ist Haswell noch sparsamer.
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • 8 GByte DDR-1600, Intel SSD 520
  • Be Quiets Erklärung zu Netzteilen für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Daten von CPU-Z für Haswell
  • Liste kompatibler Netzteile von Cooler Master
  • Die Animation von PNGs mit Power Director per AVX lastet alle Kerne aus.
  • Power Director beim WMV-Transkodieren nutzt nur vier Kerne, und nicht einmal ganz.
  • 75 mal schneller - aber nur mit 3DMark06
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Die ersten Haswell-Modelle mit Daten und Preisen laut Intel
  • Intel erklärt die Neuerungen bei Haswell.
  • Zwei neue Ports
  • Intel erklärt die Neuerungen bei Haswell.
  • Der neue Spannungswandler
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Das Die von Haswell mit den Funktionseinheiten - nach aktuellsten Angaben besteht es aus 1,6 nicht 1,4 Milliarden Transistoren.
  • Für Ultrabooks können CPU mit GPU und Chipsatz auf einem Package sitzen.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Intel erklärt die Neuerungen bei Haswell.
  • Lightroom 3.5 lastet auch mit Haswell die Kerne nur sporadisch aus.
  • Zwei Dies von Haswell-CPUs auf einem Wafer.
  • Wafer mit Haswell-Dies
  • Blockdiagramm des Chipsatzes Z87 - die vielen USB-3-Ports kommen durch Hubs zustande.
Zwei neue Ports

Die größte Neuerung der Kerne von Haswell steckt in der Befehlssatzerweiterung "Advanced Vector Extensions 2" (AVX2) und der Unterstützung von "fused multiply add" (FMA). Bei letzterem können die Ergebnisse von Multiplikationen in einem Rutsch addiert werden, was vor allem bei 3D-Modellen oder Matrizenoperationen hilfreich ist. AVX2 ist eine Weiterentwicklung der SIMD-Verarbeitung, die bei Intel SSE heißt. Gegenüber 128 Bit breiten Daten wie bei Nehalem können Sandy Bridge, Ivy Bridge und nun auch Haswell mit 256 Bit breiten Vektoren umgehen. Die Neuerung bei Haswell: die AVX-Einheiten sind doppelt so schnell geworden.

Statt 16 Rechenoperationen pro Takt wie noch bei Sandy Bridge kann Haswell 32 Flops ausführen, jedenfalls bei einfacher Genauigkeit. Ist Double-Precision gefragt, sind es 16 statt 8 Flops. Auf dem Papier ergibt sich so bei gleichem Takt die doppelte Leistung bei AVX-Befehlen, aber: Wie bei allen Befehlssatzerweiterungen müssen Programme das unterstützen. Dies könnte in diesem Fall aber schneller passieren als bei früheren Erweiterungen wie MMX und SSE, da auch AMD seit den Bulldozer-Kernen AVX anbietet.

Golem Karrierewelt
  1. Kubernetes Dive-in-Workshop: virtueller Drei-Tage-Workshop
    19.-21.07.2022, Virtuell
  2. Azure und AWS Cloudnutzung absichern: virtueller Zwei-Tage-Workshop
    22./23.09.2022, virtuell
Weitere IT-Trainings

Damit FMA und AVX2 ihre höhere Leistung in den Rechenwerken erreichen, hat Intel vor allem durch Änderungen am Frontend die Bandbreite innerhalb des Prozessors erhöht. Die Bandbreite für das Laden und Speichern (Load/Store) ist gegenüber Ivy Bridge 64 bzw. 32 Byte pro Takt verdoppelt worden, Gleiches gilt für den L2-Cache, der nun mit 64 Byte statt vorher 32 Byte pro Takt vom L1-Cache angesprochen werden kann.

Eine weitere Erweiterung, die Befehle schneller ans Ziel kommen lässt, ist die Erhöhung der Dispatch-Ports von sechs auf acht. Die beiden neuen Zugänge zu den Ausführungseinheiten kümmern sich dabei um eine ALU-Einheit und die Sprungvorhersage (Port 6) und um das Speichern (Port 7). Die restliche Zuordnung ist einem Bild in der Galerie zu diesem Artikel zu entnehmen.

Damit die höhere Bandbreite bei den schon seit vielen Generationen asynchron arbeitenden Prozessoren quer über das Die aufrechterhalten werden kann, haben die Entwickler zusätzlich die Größe der Buffer erhöht. So können beispielsweise mit Haswell 192 Befehle im Out-of-Order-Verfahren umsortiert werden, sie werden abseits von den Caches in einem Buffer gespeichert. Bei Sandy Bridge waren es nur 168 Befehle.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Schnellste Grafik vor allem für NotebooksIntegrierter Spannungswandler und neue Anforderungen an Netzteile 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14.  


Anonymer Nutzer 04. Jun 2013

Dann lach du mal sinnfrei rum. Ist mir total schnuppe. Eine "aktuelle NVIDIA oder AMD...

narfomat 04. Jun 2013

ich hoffe durch diesen marketing bullshit werden alle glauben haswell ist das absolute...

caddy77 04. Jun 2013

3dcenter.org . Die haben eine Zusammenfassung von fast 20 Haswell Reviews ausgewertet!

Anonymer Nutzer 04. Jun 2013

Und ich als Linuxer freu mich über die brauchbare Spielegrafik mit Open Source Treiber...



Aktuell auf der Startseite von Golem.de
Microsoft
Exchange Server von gut versteckter Hintertür betroffen

Sicherheitsforscher haben eine Backdoor gefunden, die zuvor gehackte Exchange-Server seit 15 Monaten zugänglich hält.

Microsoft: Exchange Server von gut versteckter Hintertür betroffen
Artikel
  1. Ayn Loki Zero: Dieses PC-Handheld kostet nur 200 US-Dollar
    Ayn Loki Zero
    Dieses PC-Handheld kostet nur 200 US-Dollar

    Es ist das bisher günstigste Modell in einer Reihe von vielen: Der Loki Zero mit 6-Zoll-Display nutzt einen Athlon-Prozessor mit Vega-Grafik.

  2. US-Streaming: Immer mehr Netflix-Abonnenten kündigen nach einem Monat
    US-Streaming
    Immer mehr Netflix-Abonnenten kündigen nach einem Monat

    Netflix hat zunehmend Probleme, neue Abonnenten zu halten. Der Anteil an Neukunden, die nach einem Monat wieder kündigen, steigt.

  3. Ducati V21L: Ducatis elektrische Rennmaschine schafft 275 km/h
    Ducati V21L
    Ducatis elektrische Rennmaschine schafft 275 km/h

    Ducati testet seit einem halben Jahr ein Elektromotorrad für den Rennsport. Der italienische Hersteller nennt Details zu Leistung und Einsatz.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte RX 6800 679€ • Samsung SSD 2TB (PS5-komp.) 249,90€ • MindStar (Zotac RTX 3090 1.399€) • Top-Spiele-PC mit AMD Ryzen 7 RTX 3070 Ti 32GB 1.700€ • Nanoleaf günstiger • Alternate (TeamGroup DDR4-3600 16GB 49,99€) Switch OLED günstig wie nie: 333€ [Werbung]
    •  /