Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen

Während AMD seine Epyc-Chips mit 64 Cores erst im Sommer 2019 veröffentlichen wird, legt Intel mit den Cascade Lake mit 56 Kernen vor: Die haben mehr Bandbreite, neue Instruktionen für doppelt so schnelle KI-Berechnungen und können persistenten Speicher ansprechen.

Artikel von veröffentlicht am
Ein Cascade Lake von Intel
Ein Cascade Lake von Intel (Bild: Marc Sauter/Golem.de)

Knapp zwei Jahre ist es her, seit Intel die erste Generation der Xeon Scalable Processors veröffentlicht hat - intern Skylake SP genannt. Seit Herbst 2018 erhalten enge Partner bereits die Nachfolge-CPUs, heute ist der offizielle Start für die zweite Generation. Deren Codename lautet Cascade Lake, wobei Intel die SP-Variante (Scalable Performance) mit bis zu 28 Kernen und die AP-Modelle (Advanced Performance) mit bis zu 56 Kernen unterscheidet.

Inhalt:
  1. Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen
  2. Deep Learning Boost für 56 Kerne
  3. AMDs Rome mit 64 Cores kommt

Wie bei den Skylake SP gibt es auch bei den Cascade Lake AP/SP mehrere Leistungsklassen - Platinum, Gold, Silver, Bronze - und neuerdings mit den 9200 noch eine zusätzliche Stufe, welche aber nicht mit einem Edelmetall wie Titanium gekennzeichnet ist. Und um das umfangreiche Portfolio ein bisschen unübersichtlicher zu machen, haben diverse Prozessoren noch ein Suffix wie ein L für besonders viel Speicher von bis zu 4,5 Terabyte pro Sockel oder ein Y für die neue Speed-Select-Technik. Verwirrend: Das Y zeigt im Ultrabook-Segment an, dass die Chips nur 5 Watt statt 15 Watt an thermischer Verlustleistung aufweisen.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
CLX-AP und CLS-SP im Überblick (Bild: Intel)

Technisch ähneln die Cascade Lake AP/SP den Skylake SP stark, denn Intel fertigt sie weiterhin in einem 14-nm-Verfahren und alle Xeon SP v2 basieren auf einer von drei Varianten: Die Low Core Count (LCC) hat 10 Kerne, die HCC (High Core Count) weist 18 auf und die Extreme Core Count (XCC) nutzt 28. Zu Die-Size oder Transistoranzahl wollte sich Intel wie üblich nicht äußern. Der Hersteller sagte aber, dass die Hardware-Härtung gegen Meltdown/Spectre und der neue VNNI-Befehlssatz die Chipgröße nicht nennenswert verändert haben. Somit bleibt offen, ob beides bereits bei den Skylake SP im Die steckte und schlicht nicht aktiviert wurde oder ob Intel eine weitere Revision aufgelegt hat.

Platinum 9200Platinum 8200Gold 6200Gold 5200Silver 4200Bronze 3200
Kernebis zu 56bis zu 28bis zu 24bis zu 18bis zu 16 6
Interface12x DDR46x DDR4 oder Optane6x DDR4 oder Optane6x DDR4 oder Optane6x DDR46x DDR4
TDPbis 400 Wattbis 205 Wattbis 200 Wattbis 125 Wattbis 100 Watt85 Watt
Sockel22, 4, 82, 42, 422
Modellreihen der Xeon Scalable Processors v2 (Cascade Lake AP/SP)

Die 2017 eingeführten Neuerungen von Skylake SP behält Cascade Lake AP/SP bei: Darunter fallen die AVX-512-Pipelines für mehr Leistung, das überarbeitete Cache-System samt Mesh statt Ringbus für die Kernkommunikation, die UPIs mit 10,6 GT/s (Ultra Path Interconnects), um zwei oder mehr Sockel LGA 3647 zu verschalten, und das sechskanalige Speicherinterface. Das unterstützt nun bis zu DDR4-2933 statt DDR4-2666 (ein Speichermodul pro Kanal, 1DPC) und eine höhere Kapazität von bis zu 2 TByte statt 1,5 TByte bei den M-Varianten. Hinzu kommt bei den L-Modellen der Support für 4,5 TByte per Optane DC Persistent Memory, einen nicht flüchtigen Speicher. Die Skylake SP können damit offiziell nicht umgehen.

Stellenmarkt
  1. Help Desk Techniker*in (m/w/d)
    Scheidt & Bachmann Parking Solutions Germany GmbH, Mönchengladbach
  2. Leitung der Abteilung Schul-IT (m/w/d)
    Landeshauptstadt Stuttgart, Stuttgart
Detailsuche

Intel hat die Cascade Lake AP/SP laut eigener Aussage in Hardware gegen Meltdown und Spectre gehärtet, wenngleich einige Varianten weiterhin nur per Microcode-Update sowie Firmware und Software angegangen werden müssen. Konkret nennt der Hersteller bei den Hardware-Härtungen die Varianten V2 (Branch Target Injection), V3 (Rogue Data Cache Load), V3a (Rogue System Register Read), V4 (Speculative Store Bypass) und somit auch L1TF (L1 Terminal Fault) welche mit Cascade Lake angegangen wurden. Generell seien die Mitigationen eher breiter denn spezifisch, andernfalls wäre der Aufwand zu hoch.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)

Wie sehr sich diese auf welche Workloads auswirken, variiert: Limitiert die Rechenleistung und finden Berechnungen im User-Space statt, fällt der Geschwindigskeitszuwachs mit 3 bis 8 Prozent eher gering aus. Mit dem FIO-Storage-Benchmark auf einem CPU-Kern bei 100 Prozent Last und kleinen 4-KByte-Dateien hingegen sind es gleich 38 Prozent, was signifikant ist. Interessant ist, dass Intel zufolge für manche Hardware-Mitigationen kein Check-Bit existiert, um die Auswirkungen dediziert zu testen. Daher präsentierte der Hersteller notgedrungen nur einen Vergleich zu den bisherigen Firmware/Software-Ansätzen bei den Skylake SP.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Deep Learning Boost für 56 Kerne 
  1. 1
  2. 2
  3. 3
  4.  


derdiedas 11. Apr 2019

Was ich festgestellt habe ist das EPYC CPUs die Leistung homogener und zuverlässiger...

das_mav 04. Apr 2019

Interessante Interpretation.

freddx12 03. Apr 2019

Musste lachen. Danke :D

Nigcra 03. Apr 2019

hast du meinen Beitrag überhaupt gelesen? VMware ist nicht das Problem. Es geht um das...

werpu 03. Apr 2019

Was ich damit meine, AMD bietet zum gleichen Zeitpunkt 64 Kerne bei viel weniger...



Aktuell auf der Startseite von Golem.de
Geekbench & GFXBench
Erste Benchmarks zeigen starken Apple M1 Max

Das Apple Silicon schneidet gut ab: Der M1 Max legt sich tatsächlich mit einer Geforce RTX 3080 Mobile und den schnellsten Laptop-CPUs an.

Geekbench & GFXBench: Erste Benchmarks zeigen starken Apple M1 Max
Artikel
  1. Kernnetz: Telekom wechselt Cisco-Router im zentralen Backbone aus
    Kernnetz
    Telekom wechselt Cisco-Router im zentralen Backbone aus

    Die Deutsche Telekom hat einen besseren Cisco-Router in ihrem zentralen Backbone installiert. Der erreicht 260 TBit/s und wirft Fragen zur IT-Sicherheit auf.

  2. Bundesverwaltungsgericht: 5G-Auktion wird erneut vor Gericht geprüft
    Bundesverwaltungsgericht
    5G-Auktion wird erneut vor Gericht geprüft

    Die Klage gegen die 5G-Auktion im Jahr 2019 wird neu verhandelt. Damit ist die komplette Vergabe erneut in Frage gestellt.

  3. Windows 11: User wollen separate Fenster in der Taskleiste zurück
    Windows 11
    User wollen separate Fenster in der Taskleiste zurück

    Windows 11 gruppiert Instanzen einer App zusammen und streicht die Möglichkeit, sie separat anzuzeigen. Das gefällt der Community gar nicht.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • HP Herbst Sale bei NBB: Bis zu 500€ Rabatt auf Gaming-Notebooks, Monitore uvm. • Kingston RGB 32GB Kit 3200 116,90€ • LG OLED48A19LA 756,29€ • Finale des GP Anniversary Sales • Amazon Music 3 Monate gratis • Saturn Gutscheinheft: Direktabzüge und Zugaben [Werbung]
    •  /