Zum Hauptinhalt Zur Navigation

Test: Intels Core i7 "Nehalem" im Turbo-Modus

Prozessoren mit Übertaktungsautomatik setzen Rekorde. Noch im November 2008 will Intel drei CPUs der Serie "Core i7" ausliefern. Mit der neuen Nehalem-Architektur samt L3-Cache, integriertem Speichercontroller und automatischer Übertaktung sind Intels High-End-Prozessoren deutlich schneller geworden. Der Stromverbrauch wurde kaum gesenkt, die Chips sind jedoch in der Anschaffung günstiger.
/ Nico Ernst
58 Kommentare News folgen (öffnet im neuen Fenster)

Intel kann sich nur noch selbst schlagen. Seit Mitte 2006 hat das Unternehmen die Performance-Krone zurückerobert und verteidigt sie seitdem stetig gegen AMD – und verlangt dafür in der Oberklasse und im High-End auch gesalzene Preise. In puncto Preis/Leistung kann AMD weiterhin mithalten, aber nur dank stetiger Preisabschläge .

Die Core-Architektur und ihr Nachfolger Penryn brauchen dabei keine extremen Taktfrequenzen, um hohe Leistung zu erzielen, eigentlich könnte es sich Intel mit den bestehenden Produkten bequem machen. Doch ebenfalls 2006 begann der Prozessorprimus, seine Strategie "Tick-Tock" umzusetzen: Jedes Jahr erscheint im Wechsel erst eine neue Architektur, danach folgt dann der Umstieg auf eine kleinere Strukturbreite.

Prozessor Takt QPI US-Dollar
Core i7-965 3,2 GHz 6,4 GT/s 999,-
Core i7-940 2,93 GHz 4,8 GT/s 562,-
Core i7-920 2,66 GHz 4,8 GT/s 284,-

War die Core-Architektur das erste "Tick", so stellte Penryn das erste "Tock" dar. Die Technik der neuen Nehalem-Architektur ist also nach Intel-Lesart die erste komplette Neuentwicklung, seit Intel sich mit "Core" wieder auf Energieeffizienz besonnen hat. Da der Vorsprung in der absoluten Rechenleistung der Intel-Prozessoren ohnehin schon sehr groß ist, kommen die auf den Produktnamen "Core i7" getauften Nehalem-CPUs zunächst nur als High-End-Modelle für Technikfans auf den Markt. Und auch die sind offenbar nicht mehr bereit, immer höhere Preise zu bezahlen. Die bisher schnellste Desktop-CPU von Intel, der Core 2 Extreme QX9770, steht aktuell noch für 1.399 US-Dollar in der Preisliste. Sein Nachfolger, Core i7 965 Extreme, soll aber nur noch 999 US-Dollar kosten.

Die drei Quad-Core-Modelle 965, 940 und 920 des Core i7 mit 3,2, 2,93 und 2,66 GHz will Intel im November 2008 ausliefern. Einen genauen Termin nennt das Unternehmen offiziell noch nicht, die üblichen Quellen gehen jedoch vom 17. November aus.

Zwar soll die Nehalem-Architektur 2009 auch in Mainstream-PCs und mit dem nächsten Centrino-Paket " Calpella " ebenfalls in Notebooks einziehen, doch bis dahin sind die Core-Prozessoren mit zwei oder vier Kernen noch das Brot- und Buttergeschäft von Intel. Diese CPUs kommen laut bereits aufgetauchter Pläne für kräftige Preissenkungen durch den Core i7 nun unter Druck.

Wir testen die Modelle 965 Extreme und 920 im Vergleich mit dem QX9770 sowie dem derzeit schnellsten AMD-Prozessor Phenom 9950 auf den jeweils schnellsten von den CPU-Herstellern empfohlenen Plattformen.

Neue Sockel, neue Chipsätze

Auf den letzten Ausgaben des "Intel Developer Forum" wurde in den für Entwickler gedachten Vorträgen klar, dass es sich bei Nehalem nicht um eine vollständig neue Architektur handelt. Vielmehr findet mit diesem Design die gründlichste Umstrukturierung der Prozessor-Infrastruktur bei Intel seit dem Pentium im Jahr 1993 statt. Der Frontside-Bus (FSB) hat endlich ausgedient, und wie bei AMD mit dem Athlon64 im Jahr 2003 sitzt nun auch bei Intel-Prozessoren der Speichercontroller auf dem Die der CPU.

War der FSB neben der Anbindung des Hauptspeichers bisher auch für die anderen Busse des Systems wie PCI-Express zuständig, so dient dafür nun "Quick Path Interconnect" (QPI). Dabei handelt es sich um ein serielles Interface, das je nach Taktung bis zu 6,4 Gigatransfers pro Sekunde befördern kann, was netto rund 12 GByte/s entspricht. Die Verwandtschaft zum HyperTransport von AMD ist nicht zu übersehen.

Speichercontroller und QPI standen bei Intel im Mittelpunkt der Nehalem-Entwicklung, so dass man diese Elemente in den Blockdiagrammen "Uncore" genannt hat – was "Core" heißt, ist im Wesentlichen das Design von Core- und Penryn-Prozessoren. Dabei wurde der L2-Cache jedoch auf 256 KByte je Kern beschnitten, und dafür ein 8 MByte großer L3-Cache angeflanscht. Wie schon den " Smart Cache " von Core und Penryn, so können sich die Kerne den L3-Cache flexibel teilen.

Die neuen Schnittstellen und der Speichercontroller bedingen auch neue Sockel. Die Core-i7-Prozessoren passen nur noch in den "LGA 1366", die Ziffer gibt die Zahl der Kontakte an. Die gegenüber dem 2004 eingeführten LGA 775 fast verdoppelten Anschlüsse sind durch die drei Speicherkanäle für DDR3-Speicher bedingt. Neue Kühler sind auch Pflicht, da sich der Lochabstand im Mainboard für die Montageöffnungen auf 80 Millimeter erhöht hat.

Die bei Intel "I/O Hub" genannte Northbridge mit QPI-Anschluss wurde unter dem Namen "Tylersburg" entwickelt. Vermarktet wird der neue Chipsatz, den die Southbridge ICH10 komplettiert, als X58. QPI dient hier aber nur für die Anbindung des I/O-Hub, für die Southbridge reicht Intels DMI-Bus noch aus.

Wie schnell QPI getaktet ist, bestimmt der Prozessor. Beim 965 sind es 3,2 GHz, bei den kleineren Core i7 2,4 GHz. Auch den Takt des Speichers und vor allem dessen Spannung gibt Intel vor: Mehr als 1,65 Volt dürfen es nicht sein. Erste Speicherhersteller wie OCZ und Kingston haben bereits "Triple-Channel-Kits" für Core i7-Boards angekündigt, die bis zu effektiv 2 GHz erreichen sollen. Bisher waren für solche Frequenzen meist deutlich höhere Spannungen nötig.

Mit dem X58 stehen auch zweimal 16 Lanes für PCIe-Grafikkarten zur Verfügung. Neben Marketingüberlegungen war auch das ein Grund für Nvidia, SLI für Intel-Mainboards ohne Zusatzchips wie noch bei der Skulltrail-Plattform zu öffnen. Wir konnten das auf dem X58-Board P6T Deluxe von Asus kurz testen. Zwei GeForce-9800-GTX-Karten ließen sich problemlos koppeln, Benchmarks mit schnelleren Modellen folgen in einem späteren Test.

Nehalem-Architektur im Überblick

Auch wenn die Kerne eine deutliche Verwandtschaft zu Core und Penryn zeigen, kommt ein neues Intel-Design doch nicht ohne Erweiterungen aus. Bei Nehalem hat Intel die Parallelität in der CPU deutlich erhöht – und das nicht nur durch HyperThreading. Unter anderem kann der Prozessor nun 128 dekodierte Micro-Ops "in flight" halten, beim Core waren es nur 96.

Das Konzept, mehrere dieser Micro-Ops zu einer zusammenzufassen, hatte Intel bereits mit dem Pentium M eingeführt und mit Core als Micro-Ops-Fusion erweitert. Bei Nehalem kann diese Fusion nun auch mit vier Verzweigungsbedingungen zusammenarbeiten. Bei der in allen modernen x86-CPUs (mit Ausnahme des Atom) üblichen Out-of-Order-Execution spart das in Nehalem Latenzen ein.

Dazu dient auch eine Erkennung von allerdings recht kleinen Schleifen. Der "Loop Stream Detector" kann bis zu 28 Micro-Ops alleine ausführen, ohne dass diese vorher wieder dekodiert werden müssten. Wie sich in unseren Benchmarks noch zeigt, profitieren offenbar Kompressionsalgorithmen davon, weniger jedoch komplexe Schleifen wie Video-Codecs.

Nicht nur für Programme, sondern auch für die sie bearbeitenden Daten hat Intel den TLB bei Nehalem erweitert. Alle modernen CPUs verfügen über diesen "translation lookaside buffer", der virtuelle Adressen in physikalische Speicheradressen übersetzt. Ein TLB lässt sich in wenigen Takten durchsuchen, seine Größe ist jedoch durch die Bauform und daraus resultierende Hitzeprobleme stark begrenzt. Maximal 512 Adressen passen in die zweite Stufe des TLB bei Nehalem.

Diese zweite Stufe des TLB ist nur für 4 KByte große Speicherseiten gedacht, Adressen von bis zu 4 MByte kann weiterhin die erste Stufe des TLB speichern. Bei Befehlen lässt sie sich zudem auf die Threads aufteilen.

Einen neuen Befehlssatz hat sich Intel diesmal gespart, sondern SSE4 nur leicht erweitert. Die "Advanced Vector Extensions" ( AVX ) beherrscht erst der Nehalem-Nachfolger "Sandy Bridge" im Jahr 2010. Dann stehen SIMD-Befehle- und Datentypen mit bis zu 256 Bit Breite auf dem Programm.

Die ersten Core i7 bestehen aus einem einzelnen Die mit den vier Kernen, das aus 731 Millionen Transistoren auf 263 Quadratmillimetern besteht. Sie werden wie bisher in 45 Nanometer Strukturbreite gefertigt. Gegenüber den zwei Dual-Core-Dies eines Core-2-Quad von je 106 Quadratmillimetern ist der Siliziumaufwand also höher geworden.

Die Rückkehr des HyperThreading

Am meisten spürbare Leistung bei gut in Threads aufgeteilten Programmen bringt jedoch immer noch das schon vom Pentium 4 bekannte HyperThreading. Dabei werden Funktionseinheiten der Kerne flexibel genutzt. Was gerade nichts zu tun hat, bietet sich dem Betriebssystem wie ein weiterer Kern an. Die CPU herrscht jedoch alleine über die Verteilung der Aufgaben auf die virtuellen Kerne.

Bei einer In-Order-Maschine wie dem Atom-Prozessor kann HyperThreading über 50 Prozent mehr Rechenleistung bringen, für den Nehalem erhofft sich Intel immerhin noch ein Drittel. Das klingt nach wenig, entspricht jedoch bei einem Quad-Core immerhin der Leistung von 5,3 Kernen – im besten Fall.

Steigerungen von 10 bis 20 Prozent sind jedoch meistens machbar, wir haben das exemplarisch mit dem nahezu perfekt mit der Zahl der Kerne skalierenden Cinebench R10 ausprobiert. Mit eingeschaltetem HyperThreading rechnet das Programm 18 Prozent schneller.

In der Praxis ist HyperThreading, wie schon beim Pentium 4, vor allem schlecht messbar, aber spürbar. Auch unter hoher Last, wie etwa beim Cinebench, lassen sich komplexe Programme noch schnell starten und reagieren auf Eingaben flott, weil das Betriebssystem die Zugriffe auf noch mehr Kerne verteilen kann.

Sollten Anwendungen durch HyperThreading gebremst werden oder gar mit acht Kernen nicht laufen wollen, kann man die Funktion im BIOS von X58-Mainboards ausschalten.

Turbo-Modus, solange die Kühlung reicht

Was 1989 noch für einen ganzen Prozessor, den 80486, als Transistoranzahl reichte, hat Intel im Core i7 alleine für die "Power Control Unit" (PCU) verbaut: Rund eine Million Transistoren steuern, welcher Teil der CPU wie viel Strom verbrauchen darf. Dieser Aufwand dient dabei nicht allein der Sparsamkeit.

Wie schon einige Serverprozessoren von Intel kann der Core i7 sich selbst übertakten, wenn einige Kerne wenig zu tun haben. Diejenigen, die unter Last stehen – etwa, weil eine Anwendung nur wenige Kerne nutzt -, laufen dann schneller. Die PCU steuert das Verfahren und schaltet höchstens zwei der vier physikalischen Kerne in den Turbo-Modus. Dabei werden sie um zwei "Speed Bins" übertaktet. Mit diesem Begriff bezeichnen die Halbleiterbauer die Abstufungen einer Modellreihe.

Im Falle des Nehalem werden die Speed Bins über den Multiplikator definiert, das 2,66-GHz-Modell Core i7 920 arbeitet beispielsweise mit einem Multiplikator von 18. Im Turbo-Modus können zwei Kerne aber mit Multiplikator 20 auch 2,93 GHz erreichen. Der Core i7 940 kann so statt 2,93 GHz auch bei 3,2 GHz laufen, und das Extrem-Modell 965 dreht von 3,2 GHz auf 3,46 GHz.

Wann das wie lange geschieht, entscheidet allein die PCU, die dazu Spannung, Stromstärke und Temperatur an verschiedenen Punkten des Prozessors misst. Sie richtet sich dazu nach der im BIOS angegebenen TDP, die mutige Übertakter auch auf eigene Gefahr erhöhen können – wir haben sie für unseren Test bei den spezifizierten 130 Watt belassen.

Da der Task-Scheduler von Windows Vista nach Belieben Tasks von einem auf den anderen Kern verlagert, können bei Anwendungen, die nur wenige Threads verwenden, die belasteten Kerne ständig wechseln. Das von Intel als zuverlässig bezeichnete Programm CPU-Z in Version 1.48 zeigte jedoch konstante Takte je nach Last an.

Der nominale Takt ist bei den Core i7 damit nur die minimal garantierte Frequenz. In der Praxis arbeiten die Prozessoren stets um eine oder zwei Multiplikatorstufen höher, wenn nicht gerade alle vier Kerne ausgelastet sind. Gerade ältere Programme, die nur wenige Threads starten, erhalten so einen kleinen Leistungsschub. Auch wenn der "Turbo-Modus" nach Marketinggag klingt, ist er so ein echter Vorteil. Das alles funktioniert jedoch nur, solange die Kühlung genau im vorgegebenen Rahmen liegt.

Testsysteme und Verfahren

Intel schickte zusammen mit dem X58-Mainboard "X58SO" (auch bekannt als "Smackover") einen Core i7 965 sowie einen 920 zum Test. Das weltweit einheitliche "Reviewers Kit" enthielt zudem 3 GByte DDR3-Speicher von Qimonda mit 1.066 MHz sowie die SSD X25-M mit 80 GByte. Die Solid-State-Disc erreichte in kurzen qualitativen Tests Leseraten von 230 MByte pro Sekunde und schrieb Daten mit rund 60 MByte pro Sekunde.

Die hohen Geschwindigkeiten sorgen vor allem bei den Anwendungstests für viel Tempo, so dass der Massenspeicher weniger zum Flaschenhals wird und die Prozessoren zeigen dürfen, was sie wirklich können. Wir haben deshalb alle Testsysteme mit der Intel-SSD betrieben.

Der ebenfalls laut Intel im November 2008 verfügbare Core i7 940 mit 2,93 GHz wurde noch nicht zur Verfügung getellt. Intel empfahl, seine Leistungsfähigkeit durch Heruntertakten des 965 nachzubilden. Das ist bei identischen Dies ein vertretbares Verfahren, wir haben dennoch darauf verzichtet. Die Skalierungsfähigkeit der Architektur zeigt sich auch durch die Tests des 920, in puncto Leistungsaufnahme ist jedoch nicht auszuschließen, dass sich 940 und 965 deutlich unterscheiden.

Neben der Hardware schlug Intel auch eine Reihe von Tests vor, die wir jedoch bis auf gängige Benchmarks wie 3DMark Vantage und Cinebench R10 zugunsten praktischer Anwendungszenarien ersetzt haben. Beim empfohlenen WinRAR 3.8 setzten wir nicht die von Intel gelieferten TIFF-Dateien, sondern eigene RAW-Bilder aus einer Nikon-DSLR ein.

Durch die drei Speicherkanäle lässt sich mit praxisnahen Speichermengen nur bei 3 GByte die gleiche Bestückung auf Dual-Channel-Systemen erreichen. Mit 2 x 1 GByte und 2 x 512 MByte ist das jedoch problemlos möglich, moderne Chipsätze vertragen auch nichtidentische Module und erreichen dabei ihre volle Leistung. Das gilt auch für Phenom-Systeme, wie AMD bestätigte .

Gegen das X58SO und die Nehalems traten ein Core 2 Extreme QX9770 (3,2 GHz) auf dem Gigabyte-Mainboard X48-DQ6 mit den gleichen Speichermodulen und ein Phenom 9950 auf dem Gigabyte MA790GP-DS4H an. Der 9950 mit 2,6 GHz ist AMDs derzeit schnellste CPU, ihm standen 3 GByte DDR2-Speicher mit 1.066 MHz zur Seite.

Als Netzteil diente ein 850-Watt-Modell von BeQuiet (Dark Power Pro), die Grafik stellte die Radeon HD 4870 X2 mit zwei R700-GPUs samt Catalyst-Treiber 8.10. Alle Tests fanden unter Windows Vista Ultimate SP1 in der 32-Bit-Version mit aktuellen Chipsatztreibern statt.

Synthetische Benchmarks

Cinebench R10 von Maxon basiert auf der Rendering-Anwendung Cinema4D und lastet laut Angaben des Herstellers bis zu 16 Kerne voll aus. Bei den 8 virtuellen Kernen des Core i7 war das auch gut zu beobachten, sie liefen stets zu 100 Prozent.

Erwartungsgemäß setzt der 965 hier einen neuen Rekord, aber der gleich schnell getaktete QX9770 hält noch gut mit. Der ein Fünftel langsamer getaktete 920 fällt zurück, schlägt aber AMDs Phenom 9950 noch deutlich. Der 965 ist bei diesem Test fast doppelt so schnell wie die AMD-CPU, dieses Bild zeigen jedoch nicht alle Anwendungstests. Zudem kostet der Phenom auch nur ein Fünftel des schnellsten Core i7.

Das in der ersten Version bereits 1995 veröffentlichte Programm SuperPi (hier in der Ausgabe 1.5 XS, die auch unter Vista läuft) ist bei Übertaktern und Rekordjägern immer noch sehr beliebt. Es berechnet die Kreiszahl Pi auf Millionen von Nachkommastellen und gibt sehr exakte Werte aus, kleine Werte sind hier besser.

Da SuperPi kaum in Threads aufgeteilt ist, zeigt sich hier gut die Effizienz der Rechenwerke. Die Optimierung des Nehalem auf kleine Schleifen verschafft ihm offenbar einen deutlichen Vorteil gegenüber der Core-2-CPU, abgeschlagen ist auch hier der Phenom.

Noch drastischere Ergebnisse zeigen sich beim CPU-Test von 3DMark Vantage, bei dem die Grafikkarte kaum eine Rolle spielt. Das Programm arbeitet hier mit einer Physiksimulation kombiniert mit Wegfindungsalgorithmen.

Wie auch Cinebench R10 ist 3DMark Vantage voll auf möglichst viele Kerne optimiert, so dass auch der kleine Core i7 920 seinen viermal so teuren Konkurrenten aus gleichem Hause hinter sich lässt.

PC Mark Vantage

Der Test von Futuremark basiert nicht auf echten Anwendungen, nutzt aber zahlreiche Funktionen von Windows Vista aus. In der "Overall"-Suite bildet er von Medienverarbeitung über Webbrowsing bis zu Office-Programmen nahezu alle Alltagsaufgaben ab. Zudem ist er fein in Threads aufgeteilt.

Folglich gewinnt auch hier der 965, der QX9770 mit seinen großen Caches ist aber nur 8 Prozent langsamer. Dank HyperThreading ist auch der Core i7 920 noch gut im Rennen, der höher als der kleine Nehalem getaktete Phenom erreicht seinen neuen Konkurrenten fast. Bei einem Mix von Anwendungen steht AMD also nach wie vor passabel da.

Das zeigt sich noch deutlicher bei der Suite "Productivity" des PC Mark. Hier ist der Phenom sogar schneller als der 920, und auch die Abstände zu Intels Schnellsten schmelzen. Rund 18 Prozent fixer sind sie dennoch.

Das sieht bei der mit Konvertierungen und dem Mischen von Musikstücken beschäftigten Suite "Music" des Tests jedoch ganz anders aus. Hier führt wieder der 965, gefolgt von QX9770, und der Phenom reicht nur knapp an den 920 heran.

Medienbearbeitung

Mit der aktuellen Version 8.0.1 von iTunes konvertierten wir eine 700 MByte große WAV-Datei in ein MP3 mit variabler Bitrate von höchstens 256 Kilobit pro Sekunde bei maximaler Qualitätseinstellung. Dies entspricht der Zeit, die für randvolle CD nötig wäre, so deren Dateien sich schon auf der Festplatte befinden.

Core i7 965 und Core 2 QX9770 liegen hier dicht beieinander, die Unterschiede zeigten sich aber auch bei mehreren Messungen. Das liegt an der schlechten Aufteilung in Threads des MP3-Encoders von iTunes: Nur zwei Kerne lastet die Routine voll aus. Die Nehalems können hier ihr HyperThreading nicht ausspielen.

Recht ordentlich lastet alle acht virtuellen Kerne einer Nehalem-CPU der Windows Movie Maker aus. Eine 41 Minuten lange Datei aus einer HD-Kamera im Format AVCHD (1.440 x 1.080 Pixel) sind mit dem 965 in weniger als Echtzeit in eine WMV-Datei mit 720p verpackt. Dieses Format schlägt das Programm für eine Xbox 360 zur Wiedergabe vor. HyperThreading lässt hier auch den 920 gut aussehen, der QX9770 muss sich aber auch nicht verstecken.

Weniger gut in Threads aufgeteilt ist Nikons Capture NX, das unter anderem der Konvertierung von RAW-Fotos dient. Das Programm muss in unserem Test 257 Bilder von 1,36 GByte in LZW-komprimierte TIFF-Dateien wandeln. Der Core i7 965 schafft das in gut siebeneinhalb Minuten, nicht einmal eine Minute länger muss man mit dem QX9770 warten. Mit gut 10 Minuten strapazieren aber auch die anderen Prozessoren die Geduld nicht allzu sehr.

Dateikomprimierung und Spiele

Die gleichen RAW-Dateien wie beim Konvertierungstest muss WinRAR 3.8 mit normaler Kompressionsstufe in ein RAR-Archiv verpacken. Zwar lastet trotz schneller Daten von der SSD das Programm die acht HT-Kerne des Core i7 nur zu rund 60 Prozent aus, es nutzt aber zumindest alle Kerne.

Daher sind beide Nehalems hier die schnellsten, sogar der QX9770 muss sich dieser Aufgabe geschlagen geben, die aus kleinen Schleifen besteht.

Im Level "Lost Planet" macht das Spiel Crysis ausführlich Gebrauch von Physikeffekten für recht realitätsnahe Darstellung von Nebel, Rauch und Schneetreiben. Laut Crytek skaliert das Spiel gut mit Mehrkern-CPUs, auch wenn es sie nicht immer voll auslastet.

Um den Einfluss der ohnehin schnellen Grafikkarte zu minimieren, testen wir bei 1.280 x 1.024 Pixeln Auflösung in der Einstellung "High", die schon die meisten Effekte darstellt. Die Verteilung auf acht Kerne lässt beide Core i7-CPUs hier gewinnen, der 965 zieht sogar noch deutlich davon.

Diese überraschenden Ergebnisse ließen sich mehrfach wiederholen, auf einem zweiten Monitor zeigte sich bei nicht bewerteten Versuchen mit dem Taskmonitor, dass Vista ständig die Tasks neu verteilt und die Nehalem-CPUs häufig den Turbo-Modus nutzen konnten. Gepaart mit HyperThreading verschaffen sie sich so den Vorteil. Dieser Effekt kommt jedoch nicht bei allen Szenen von Crysis zum Tragen, nur das Eis-Level ist durch die Physik-Engine derart CPU-lastig.

Leistungsaufnahme

Auch wenn der schnellste Core i7 ein Fünftel höher getaktet ist als der kleinste gibt Intel für alle Prozessoren eine typische Leistungsaufnahme (thermal design power, TDP) von 130 Watt an. In der Praxis schwankt, wie schon bei den Core-2-CPUs, die Leistungsaufnahme stark. Zwischen Idle-Modus und voller Rechenleistung können fast 100 Watt liegen, zudem hat jede einzelne CPU eine andere "Load Line", welche die für einen bestimmten Takt nötige Spannung beschreibt.

Die beiden Core i7 wollten sich auch im Energiesparmodus von Windows Vista, der über die Systemsteuerung einstellbar ist, nicht unter 1,6 GHz takten. Um auzuloten, wie sparsam sie sein können, haben wir die 4870-X2-Karte durch eine Radeon HD 4670 ersetzt, die für den Vista-Desktop laut AMD nur 11 Watt benötigt. Auf die Messergebnisse des Render-Test von Cinebench R10, den wir für die Volllastmessung verwendet haben, hat diese Karte keinen Einfluss.

Über die verschiedenen Steppings werden Prozessoren immer sparsamer – und so ist im Stromparen der QX9770, wie die Nehalems mit 130 TDP angegeben, der Sieger. Der Phenom ist trotz einer TDP von 140 Watt auf dem Desktop sogar noch etwas weniger energiehungrig als der schnellste Core i7.

Unter Volllast benötigt das schnellste Core-i7-System am meisten Strom, wenn auch nur knapp mehr als die Phenom-Plattform. Mit Bezug auf die Rechenleistung ist aber auch dabei der QX9770 am effizientesten. Bei einer schon ein Jahr verfügbaren Architektur ist das kein Wunder, etwas mehr Engagement beim Stromsparen hätte man sich von Intel aber schon wünschen können.

Fazit:

Intel hat sich selbst geschlagen – teils deutlich, teils knapp. Von HyperThreading können nur sehr fein in Threads aufgeteilte, und damit sehr moderne Anwendungen, deutlich profitieren. Auch ältere Programme und viele Spiele gewinnen durch den Turbo-Modus erheblich an Geschwindigkeit. Durch diese automatische Übertaktung muss man sich endgültig davon verabschieden, Prozessoren vor allem nach ihrer Taktfrequenz einzuordnen. Was beim Core i7 als 3,2-GHz-CPU verkauft wird, kann in einem gut gekühlten System mit voller Herstellergarantie konstant mit 3,33 GHz laufen.

Wie schon bei anderen High-End-CPUs ist auch beim Core i7 die Medienbearbeitung das einzige Feld an allgemein verbreiteten Anwendungen, bei denen diese Boliden ihre Vorteile voll ausspielen können. So erklärt sich auch, warum Intel frühestens in einem Dreivierteljahr die Nehalem-Architektur mit günstigeren Chipsätzen für den Massenmarkt anbieten will.

Bis dahin bleiben die Core-2-Prozessoren in der Mittelklasse attraktiv. AMD dagegen spielt nun, so traurig das im Sinne eines gesunden Wettbewerbs auch sein mag, nur noch bei CPUs unter 160 Euro mit. Es bleibt zu hoffen, dass die für den Januar 2009 erwarteten Phenoms mit Deneb-Kern Intel wieder mehr Konkurrenz machen – und pünktlich erscheinen.

Das wird umso drängender, da Intel mit weiteren Steppings des Core i7 – die erfahrungsgemäß immer weniger elektrische Leistung aufnehmen – noch Spielraum nach oben bei den Taktfrequenzen haben dürfte. Mit QPI und dem ausgefeilten Powermanagement sind zudem die Grundsteine für Server- und Notebookversionen gelegt. Anders als bei der Core-Architektur, die den Markt im Sturm eroberte, wird der flächendeckende Umstieg auf die Nehalems aber wesentlich länger dauern.


Relevante Themen