• IT-Karriere:
  • Services:

Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen

Während AMD seine Epyc-Chips mit 64 Cores erst im Sommer 2019 veröffentlichen wird, legt Intel mit den Cascade Lake mit 56 Kernen vor: Die haben mehr Bandbreite, neue Instruktionen für doppelt so schnelle KI-Berechnungen und können persistenten Speicher ansprechen.

Artikel von veröffentlicht am
Ein Cascade Lake von Intel
Ein Cascade Lake von Intel (Bild: Marc Sauter/Golem.de)

Knapp zwei Jahre ist es her, seit Intel die erste Generation der Xeon Scalable Processors veröffentlicht hat - intern Skylake SP genannt. Seit Herbst 2018 erhalten enge Partner bereits die Nachfolge-CPUs, heute ist der offizielle Start für die zweite Generation. Deren Codename lautet Cascade Lake, wobei Intel die SP-Variante (Scalable Performance) mit bis zu 28 Kernen und die AP-Modelle (Advanced Performance) mit bis zu 56 Kernen unterscheidet.

Inhalt:
  1. Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen
  2. Deep Learning Boost für 56 Kerne
  3. AMDs Rome mit 64 Cores kommt

Wie bei den Skylake SP gibt es auch bei den Cascade Lake AP/SP mehrere Leistungsklassen - Platinum, Gold, Silver, Bronze - und neuerdings mit den 9200 noch eine zusätzliche Stufe, welche aber nicht mit einem Edelmetall wie Titanium gekennzeichnet ist. Und um das umfangreiche Portfolio ein bisschen unübersichtlicher zu machen, haben diverse Prozessoren noch ein Suffix wie ein L für besonders viel Speicher von bis zu 4,5 Terabyte pro Sockel oder ein Y für die neue Speed-Select-Technik. Verwirrend: Das Y zeigt im Ultrabook-Segment an, dass die Chips nur 5 Watt statt 15 Watt an thermischer Verlustleistung aufweisen.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
CLX-AP und CLS-SP im Überblick (Bild: Intel)

Technisch ähneln die Cascade Lake AP/SP den Skylake SP stark, denn Intel fertigt sie weiterhin in einem 14-nm-Verfahren und alle Xeon SP v2 basieren auf einer von drei Varianten: Die Low Core Count (LCC) hat 10 Kerne, die HCC (High Core Count) weist 18 auf und die Extreme Core Count (XCC) nutzt 28. Zu Die-Size oder Transistoranzahl wollte sich Intel wie üblich nicht äußern. Der Hersteller sagte aber, dass die Hardware-Härtung gegen Meltdown/Spectre und der neue VNNI-Befehlssatz die Chipgröße nicht nennenswert verändert haben. Somit bleibt offen, ob beides bereits bei den Skylake SP im Die steckte und schlicht nicht aktiviert wurde oder ob Intel eine weitere Revision aufgelegt hat.

Platinum 9200Platinum 8200Gold 6200Gold 5200Silver 4200Bronze 3200
Kernebis zu 56bis zu 28bis zu 24bis zu 18bis zu 16 6
Interface12x DDR46x DDR4 oder Optane6x DDR4 oder Optane6x DDR4 oder Optane6x DDR46x DDR4
TDPbis 400 Wattbis 205 Wattbis 200 Wattbis 125 Wattbis 100 Watt85 Watt
Sockel22, 4, 82, 42, 422
Modellreihen der Xeon Scalable Processors v2 (Cascade Lake AP/SP)

Die 2017 eingeführten Neuerungen von Skylake SP behält Cascade Lake AP/SP bei: Darunter fallen die AVX-512-Pipelines für mehr Leistung, das überarbeitete Cache-System samt Mesh statt Ringbus für die Kernkommunikation, die UPIs (Ultra Path Interconnects), um zwei oder mehr Sockel LGA 3647 zu verschalten, und das sechskanalige Speicherinterface. Das unterstützt nun bis zu DDR4-2933 statt DDR4-2666 (ein Speichermodul pro Kanal, 1DPC) und eine höhere Kapazität von bis zu 2 TByte statt 1,5 TByte bei den M-Varianten. Hinzu kommt bei den L-Modellen der Support für 4,5 TByte per Optane DC Persistent Memory, einen nicht flüchtigen Speicher. Die Skylake SP können damit offiziell nicht umgehen.

Stellenmarkt
  1. Allianz Deutschland AG, München Unterföhring
  2. operational services GmbH & Co. KG, Berlin, Frankfurt am Main

Intel hat die Cascade Lake AP/SP laut eigener Aussage in Hardware gegen Meltdown und Spectre gehärtet, wenngleich einige Varianten weiterhin nur per Microcode-Update sowie Firmware und Software angegangen werden müssen. Konkret nennt der Hersteller bei den Hardware-Härtungen die Varianten V2 (Branch Target Injection), V3 (Rogue Data Cache Load), V3a (Rogue System Register Read), V4 (Speculative Store Bypass) und somit auch L1TF (L1 Terminal Fault) welche mit Cascade Lake angegangen wurden. Generell seien die Mitigationen eher breiter denn spezifisch, andernfalls wäre der Aufwand zu hoch.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)

Wie sehr sich diese auf welche Workloads auswirken, variiert: Limitiert die Rechenleistung und finden Berechnungen im User-Space statt, fällt der Geschwindigskeitszuwachs mit 3 bis 8 Prozent eher gering aus. Mit dem FIO-Storage-Benchmark auf einem CPU-Kern bei 100 Prozent Last und kleinen 4-KByte-Dateien hingegen sind es gleich 38 Prozent, was signifikant ist. Interessant ist, dass Intel zufolge für manche Hardware-Mitigationen kein Check-Bit existiert, um die Auswirkungen dediziert zu testen. Daher präsentierte der Hersteller notgedrungen nur einen Vergleich zu den bisherigen Firmware/Software-Ansätzen bei den Skylake SP.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Deep Learning Boost für 56 Kerne 
  1. 1
  2. 2
  3. 3
  4.  


Anzeige
Spiele-Angebote
  1. (-74%) 15,50€
  2. 4,32€
  3. 52,99€
  4. 20,49€

derdiedas 11. Apr 2019

Was ich festgestellt habe ist das EPYC CPUs die Leistung homogener und zuverlässiger...

das_mav 04. Apr 2019

Interessante Interpretation.

freddx12 03. Apr 2019

Musste lachen. Danke :D

Nigcra 03. Apr 2019

hast du meinen Beitrag überhaupt gelesen? VMware ist nicht das Problem. Es geht um das...

werpu 03. Apr 2019

Was ich damit meine, AMD bietet zum gleichen Zeitpunkt 64 Kerne bei viel weniger...


Folgen Sie uns
       


Galaxy Fold im Test

Das Galaxy Fold ist Samsungs erstes Smartphone mit faltbarem Display. Die Technologie ist spannend, im Alltag nervt uns das ständige Auf- und Zuklappen aber etwas.

Galaxy Fold im Test Video aufrufen
Staupilot: Der Zulassungsstau löst sich langsam auf
Staupilot
Der Zulassungsstau löst sich langsam auf

Nach jahrelangen Verhandlungen soll es demnächst internationale Zulassungskriterien für hochautomatisierte Autos geben. Bei höheren Automatisierungsgraden strebt die Bundesregierung aber einen nationalen Alleingang an.
Ein Bericht von Friedhelm Greis

  1. Autonomes Fahren Ermittler geben Testfahrerin Hauptschuld an Uber-Unfall
  2. Ermittlungsberichte Wie die Uber-Software den tödlichen Unfall begünstigte
  3. Firmentochter gegründet VW will in fünf Jahren autonom fahren

Macbook Pro 16 Zoll im Test: Ein Schritt zurück sind zwei Schritte nach vorn
Macbook Pro 16 Zoll im Test
Ein Schritt zurück sind zwei Schritte nach vorn

Keine Butterfly-Tastatur mehr, eine physische Escape-Taste, dünnere Displayränder: Es scheint, als habe Apple beim Macbook Pro 16 doch auf das Feedback der Nutzer gehört und ist einen Schritt zurückgegangen. Golem.de hat sich angeschaut, ob sich die Änderungen auch lohnen.
Ein Test von Oliver Nickel

  1. Audioprobleme Knackgeräusche beim neuen Macbook Pro 16 Zoll
  2. iFixit Kleber und Nieten im neuen Macbook Pro 16 Zoll
  3. Macbook Pro Apple gibt fehlerhafte Butterfly-Tastatur auf

Mobile-Games-Auslese: Märchen-Diablo für Mobile-Geräte
Mobile-Games-Auslese
Märchen-Diablo für Mobile-Geräte

"Einarmiger Schmied" als Klasse? Diablo bietet das nicht - das wunderschöne Yaga schon. Auch sonst finden sich in der neuen Mobile-Games-Auslese viele spannende und originelle Perlen.
Von Rainer Sigl

  1. Mobile-Games-Auslese Fantasypixel und Verkehrsplanung für unterwegs
  2. Mobile-Games-Auslese Superheld und Schlapphutträger zu Besuch im Smartphone
  3. Mobile-Games-Auslese Verdrehte Räume und verrückte Zombies für unterwegs

    •  /