Xeon E5-2600v3 mit Haswell-EP: 18 Intel-Kerne in einem Prozessor
Intel bietet jetzt die ersten Xeon-Prozessoren basierend auf dem Haswell-EP genannten Design an. Diese werden wie andere Haswell-Prozessoren noch im 22-nm-Prozess gefertigt. Broadwell mit seinem 14-nm-Prozess bleibt weiterhin den ebenfalls neuen Core-M-Prozessoren vorbehalten .
Trotzdem ist ein Haswell-EP-Xeon eine Neuerung, wie auch schon Ivy Bridge EX und EP mit seinen maximal 15 beziehungsweise 12 Kernen. Das steigert Intel mit Haswell-EP nochmals deutlich und nennt nun erstmals Details zu der Architektur und dem Angebot an sich, das aus zahlreichen Xeon-SKUs besteht.
18 statt 12 Kerne
Wie schon vorher bekanntgegeben wurde, setzt Intel mit Haswell-EP bis zu 18 Kerne im Maximalausbau auf dem Die ein . Auf dem Foto eines Wafers, das wir geschossen haben, lassen sich die Kerne gut abzählen. Vor allem ist gut zu sehen, wie groß das Die auf dem Wafer ist und wie viel Verschnitt eine derart große CPU verursacht.
Insgesamt drei unterschiedliche Dies wird Intel als Basis nutzen. Das größte, auch im Foto zu sehende Die ist für Xeons mit 14 bis 18 Kernen vorgesehen und benötigt eine Fläche von 662 Quadratmillimetern. 5,69 Milliarden Transistoren sind auf der Fläche verbaut. 6 bis 12 Kerne bekommt Intel auf 492 qmm unter (3,84 Milliarden Transistoren).
Mit 4 bis 8 Kernen am kleinsten ist das Die mit insgesamt 2,6 Milliarden Transistoren auf einer Fläche von 354 qmm. Hier gibt es eine Überschneidung von Xeons mit 6 und 8 Kernen, die auf unterschiedlichen Dies basieren. Das hängt mit den sogenannten Home Agents zusammen sowie den Interconnect-Ringen zwischen den einzelnen Kernen. In Abhängigkeit vom Basis-Die unterscheiden sich also die 6- und 8-Kern-Konfigurationen.
Gepufferte Ringe für mehr Kerne
Intels Xeon arbeitet nun mit einem Fully Buffered Switch bei den Xeon-SKUs, die zwischen den beiden Kommunikationsringen arbeiten. An diesen Ringbussen, die durch den L3-Cache verlaufen, hängen die einzelnen CPU-Kerne. Das muss nicht einmal gleichmäßig verteilt sein. Beim größten V3-Xeon hängen an einem Ring etwa 10 Prozessoren, an dem anderen nur 8. Vorteile soll weder die eine noch die andere Ringposition eines Kerns bieten, ist sich Intel sicher. Bei einem 12-Kern-Xeon, ist sogar nur ein Ring mit 8 Kernen bestückt, der andere mit 4 Kernen. Kerne an den jeweiligen Ringen haben jeweils Zugriff auf einen sogenannten Home Agent, der sich um die Anbindung des Arbeitsspeichers kümmert. Eine CPU im Ring 2 muss also nicht mehr über den ersten Ring gehen, um auf den Speicher zuzugreifen.
Aufspüren und Isolieren störender Nachbarn
Mit Haswell-EP hat Intel ein paar technische Feinheiten auf die Prozessoren gebracht. So gibt es jetzt etwa eine Erkennung für "Noisy Neighbours". Damit sind Kerne gemeint, die aufgrund ihrer Aufgabe die Leistung des Prozessors senken. Diese Erkennung hatten die Vorgänger noch nicht. Als Beispiel nannte Intel etwa eine virtuelle Maschine (VM), die eine hohe Last auf dem Cache erzeugt. Mit neuen Werkzeugen ist es möglich, eine solche virtuelle Maschine zu isolieren, damit die Störungen die Nachbarn nicht mehr betreffen. Besonders unangenehm für einen Prozesser soll eine VM sein, die gerade mit dem Transcodieren von Videoinhalten beschäftigt ist. Mit der neuen Xeon-Plattform sollen diese schnell erkannt und anschließend isoliert werden.
Übrigens kümmert sich auch weiterhin das Betriebssystem um die Zuteilung der Aufgaben auf die einzelnen Kerne. Intel versicherte, dass Aufgaben nicht einfach im Hintergrund von Kern zu Kern bewegt werden. Auch für das Cache-Monitoring ist eine Unterstützung des Betriebssystem notwendig.
Ebenfalls neu ist die Spezialität Cluster on Die. Damit werden einzelne Kerne zusammengefasst und der Cache klar aufgeteilt. Dabei müssen die Kerne nicht einmal auf dem selben Ring liegen. Ohnehin glaubt Intel nicht, dass die Position eines Kerns die Leistung in der Praxis beeinflusst.
Zu den Feinheiten gehört der integrierte Voltage Regulator (IVR). Der war beim Vorgänger noch außerhalb des Prozessors. Laut Intel lassen sich die einzelnen Kerne so genauer ansteuern und der Wechsel zwischen den Energiemodi verläuft schneller. Wenn der Prozessor wenig zu tun hat, kühlt er also auch schneller wieder ab, da die Leistungsaufnahme zeitnaher reduziert wird.
Zur gesamten Xeon-Plattform gehören noch weitere Neuheiten. So wird etwa erstmals DDR4-Speicher eingesetzt. Das wird allerdings für einen Mehrpreis verglichen mit älteren Systemen sorgen, wie HP schon bei der Vorstellung seiner Haswell-EP-Server angab. DDR4 wird zuerst in Servern und Workstations großflächig eingesetzt. Das bedeutet niedrige Stückzahlen und damit höhere Preise für das RAM. Da hilft auch der von uns getestete Core i7-5960X mit DDR4 nicht. Die Masse setzt DDR4-RAM noch nicht ein. Zudem betonte Intel, dass alle Modelle 40 PCIe-Lanes der Version 3.0 ermöglichen.
Mehr Geschwindigkeit
Intels Xeon v3 soll nicht nur feine Optimierungen und Ansätze für Werkzeuge bieten, die für höhere Geschwindigkeit sorgen, sondern auch an sich schneller arbeiten. Intel nannte diverse Benchmarkwerte, allerdings normalisiert auf die Vorgängergeneration. Zudem ging Intel häufig von typischen Upgrade-Szenarien aus. So greift ein Anwender natürlich nach der Lebenszeit seines alten Servers beim gleichen Preis manchmal zu einigen Kernen mehr. Häufig vergleicht Intel in verschiedenen Einsatzszenarien den Xeon E5-2697v2(öffnet im neuen Fenster) (12 Kerne, 2,7 GHz, 30 MByte Cache) mit dem E5-2697v3 (14 Kerne, 2,6 GHz, 35 MByte Cache), also zwei ungefähr gleich teure Modelle. Intel geht grob von Leistungssteigerungen zwischen 18 und 37 Prozent aus, je nach Einsatzszenario. Das lässt sich nicht alleine durch die höhere Anzahl an Kernen erklären.
Typische Upgrade-Pfade sehen zudem vor, dass ein Server mehrere Jahre im Einsatz bleibt. Es versteht sich von selbst, dass ein neuer Xeon dann erheblich schneller arbeitet als das alte ausgemusterte Modell. Generelle Benchmarks sind für Server jedoch ohnehin kritisch zu sehen, da dort die Tendenz zu spezialisierten Anwendungen sehr hoch ist.
AVX 2.0 soll ebenfalls für große Leistungssprünge sorgen. Allerdings muss Software dafür optimiert werden, um das Potenzial auszunutzen. Zudem takten die AVX-Einheiten anders als der Rest der CPU. Sie sind vor allem extrem energiehungrig und beeinflussen die Leistung des Rests der CPU. Der Grundtakt ist rund 300 MHz geringer. In der Galerie sind die recht komplexen Turboboost-Abstufungen besser ersichtlich. Die Geschwindigkeit wird nicht nur durch AVX beeinflusst, sondern auch durch die Anzahl der Kerne, die per Turboboost hochgetaktet werden können. Es wird interessant sein zu sehen, ob kurze AVX-optimierte Berechnungen nicht die Leistung des Prozessors insgesamt negativ beeinflussen.
An anderen Bereichen, wie etwa den QPI-Links, hat Intel ebenfalls Verbesserungen vorgenommen. Hier sind statt 8 GT/s nun 9,6 GT/s im Maximum möglich. Nicht jedes Xeon-Modell beherrscht jedoch die höchste Geschwindigkeitsstufe.
Viele Ausstattungsvarianten des Haswell-EP-Xeons
In Abhängigkeit von der SKU gibt es unterschiedliche Cache-Ausstattungen, die von 15 bis 45 MByte L3-Cache reichen. Den Turbomodus können fast alle Modelle des E5-2600v3. Nur die Modellnummern E5-2603v3 und E5-2609v3 mit sehr niedrigen Taktfrequenzen (1,6 beziehungsweise 1,9 GHz für 6 Kerne) beherrschen keinen Turbo und können noch nicht einmal Hyperthreading. Die Modelle sind zudem mit 85 Watt im mittleren TDP-Bereich für das Kühldesign angesiedelt. Die L-Serie, wie beispielsweise der E5-2630Lv3, benötigt nur 55 Watt bei 12 Kernen, Hyperthreading und 1,8 GHz. Zudem kann dieser Prozessor seinen thermischen Spielraum zum Hochtakten der Kerne ausnutzen.
Die höchste TDP-Anforderung hat übrigens der E5-2687Wv3 mit 10 Kernen (Hyperthreading, Turboboost) und einem Takt von 3,1 GHz. Das Topmodell E5-2699v3 mit 18 Kernen taktet nur mit 2,6 GHz (145 Watt TDP). Wie bei Serverprozessoren dieser Art üblich, muss sich vor dem Kauf die genaue Last angesehen werden, die erwartet wird. Lassen sich Aufgaben gut parallelisieren, wird eher zum 18-Kern-Angebot gegriffen. Für kleinere Aufgaben, die schlimmstenfalls vielleicht nur in einem Thread laufen, ist hingegen der E5-2637v3 als CPU mit der schnellsten Einzelleistung interessant. Seine vier Kerne werden mit einem Basistakt von 3,5 GHz getaktet.
Die Preisspanne ist Xeon-typisch sehr groß und einzelne Prozessoren können sehr teuer werden. Der bereits erwähnte E5-2603v3 kostet als Sechskerner ohne besondere Fähigkeiten beispielsweise nur 213 US-Dollar bei der Abnahme von 1.000 Stück. Dieser Prozessor wird sich auch in Workstations finden. Das Topmodell E5-2699v3 mit 18 Kernen 4.115 US-Dollar. Insgesamt sind 29 SKUs geplant. Dazu kommen eventuell noch Modelle, die auf Kundenwunsch hin produziert werden.
Die Prozessoren eignen sich für 2-Sockel-Systeme. Wer will, kann sich also ein System zusammenstellen, das bis zu 72 Threads berechnet. Wir konnten uns das anhand einer Vorabmessung einmal anschauen. Der Cinebench R11.5 braucht in so einem Fall nur ein paar Sekunden. Daher eignet sich dieser Test schon nicht mehr als Benchmark. Die Gefahr, dass Störungen die Messungen stark beeinflussen könnten, ist schlicht zu hoch.
- Anzeige Hier geht es zu Intel-Prozessoren bei Alternate Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.