Abo
  • IT-Karriere:

Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen

Während AMD seine Epyc-Chips mit 64 Cores erst im Sommer 2019 veröffentlichen wird, legt Intel mit den Cascade Lake mit 56 Kernen vor: Die haben mehr Bandbreite, neue Instruktionen für doppelt so schnelle KI-Berechnungen und können persistenten Speicher ansprechen.

Artikel von veröffentlicht am
Ein Cascade Lake von Intel
Ein Cascade Lake von Intel (Bild: Marc Sauter/Golem.de)

Knapp zwei Jahre ist es her, seit Intel die erste Generation der Xeon Scalable Processors veröffentlicht hat - intern Skylake SP genannt. Seit Herbst 2018 erhalten enge Partner bereits die Nachfolge-CPUs, heute ist der offizielle Start für die zweite Generation. Deren Codename lautet Cascade Lake, wobei Intel die SP-Variante (Scalable Performance) mit bis zu 28 Kernen und die AP-Modelle (Advanced Performance) mit bis zu 56 Kernen unterscheidet.

Inhalt:
  1. Cascade Lake AP/SP: Das können Intels Xeon-CPUs mit 56 Kernen
  2. Deep Learning Boost für 56 Kerne
  3. AMDs Rome mit 64 Cores kommt

Wie bei den Skylake SP gibt es auch bei den Cascade Lake AP/SP mehrere Leistungsklassen - Platinum, Gold, Silver, Bronze - und neuerdings mit den 9200 noch eine zusätzliche Stufe, welche aber nicht mit einem Edelmetall wie Titanium gekennzeichnet ist. Und um das umfangreiche Portfolio ein bisschen unübersichtlicher zu machen, haben diverse Prozessoren noch ein Suffix wie ein L für besonders viel Speicher von bis zu 4,5 Terabyte pro Sockel oder ein Y für die neue Speed-Select-Technik. Verwirrend: Das Y zeigt im Ultrabook-Segment an, dass die Chips nur 5 Watt statt 15 Watt an thermischer Verlustleistung aufweisen.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
CLX-AP und CLS-SP im Überblick (Bild: Intel)

Technisch ähneln die Cascade Lake AP/SP den Skylake SP stark, denn Intel fertigt sie weiterhin in einem 14-nm-Verfahren und alle Xeon SP v2 basieren auf einer von drei Varianten: Die Low Core Count (LCC) hat 10 Kerne, die HCC (High Core Count) weist 18 auf und die Extreme Core Count (XCC) nutzt 28. Zu Die-Size oder Transistoranzahl wollte sich Intel wie üblich nicht äußern. Der Hersteller sagte aber, dass die Hardware-Härtung gegen Meltdown/Spectre und der neue VNNI-Befehlssatz die Chipgröße nicht nennenswert verändert haben. Somit bleibt offen, ob beides bereits bei den Skylake SP im Die steckte und schlicht nicht aktiviert wurde oder ob Intel eine weitere Revision aufgelegt hat.

Platinum 9200Platinum 8200Gold 6200Gold 5200Silver 4200Bronze 3200
Kernebis zu 56bis zu 28bis zu 24bis zu 18bis zu 16 6
Interface12x DDR46x DDR4 oder Optane6x DDR4 oder Optane6x DDR4 oder Optane6x DDR46x DDR4
TDPbis 400 Wattbis 205 Wattbis 200 Wattbis 125 Wattbis 100 Watt85 Watt
Sockel22, 4, 82, 42, 422
Modellreihen der Xeon Scalable Processors v2 (Cascade Lake AP/SP)

Die 2017 eingeführten Neuerungen von Skylake SP behält Cascade Lake AP/SP bei: Darunter fallen die AVX-512-Pipelines für mehr Leistung, das überarbeitete Cache-System samt Mesh statt Ringbus für die Kernkommunikation, die UPIs (Ultra Path Interconnects), um zwei oder mehr Sockel LGA 3647 zu verschalten, und das sechskanalige Speicherinterface. Das unterstützt nun bis zu DDR4-2933 statt DDR4-2666 (ein Speichermodul pro Kanal, 1DPC) und eine höhere Kapazität von bis zu 2 TByte statt 1,5 TByte bei den M-Varianten. Hinzu kommt bei den L-Modellen der Support für 4,5 TByte per Optane DC Persistent Memory, einen nicht flüchtigen Speicher. Die Skylake SP können damit offiziell nicht umgehen.

Stellenmarkt
  1. Münchener Rückversicherungs-Gesellschaft Aktiengesellschaft in München, München
  2. Bundesamt für Verfassungsschutz, Berlin

Intel hat die Cascade Lake AP/SP laut eigener Aussage in Hardware gegen Meltdown und Spectre gehärtet, wenngleich einige Varianten weiterhin nur per Microcode-Update sowie Firmware und Software angegangen werden müssen. Konkret nennt der Hersteller bei den Hardware-Härtungen die Varianten V2 (Branch Target Injection), V3 (Rogue Data Cache Load), V3a (Rogue System Register Read), V4 (Speculative Store Bypass) und somit auch L1TF (L1 Terminal Fault) welche mit Cascade Lake angegangen wurden. Generell seien die Mitigationen eher breiter denn spezifisch, andernfalls wäre der Aufwand zu hoch.

  • CLX-AP und CLS-SP im Überblick (Bild: Intel)
  • Preise aller Modelle außer der Off-Roadmap-SKUs (Bild: Intel)
  • Cascade Lake im Überblick (Bild: Intel)
  • CLX-AP und CLS-SP im Vergleich (Bild: Intel)
  • Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)
  • Wie stark die Leistung steigt, hängt sehr vom Workload ab. (Bild: Intel)
  • Bisher war AVX-512 eher auf Gleitkomma-Berechnungen ausgelegt. (Bild: Intel)
  • Die VNNI-Instruktionen steigern den Durchsatz der INT8- und INT16-Formate. (Bild: Intel)
  • INT8 per VNNI erhöht die Leistung signifikant. (Bild: Intel)
  • Der Befehl verringert zu FP32 die Cache-Misses ... (Bild: Intel)
  • ... und benötigte Daten brauchen weniger Bandbreite. (Bild: Intel)
  • Vorteile von VNNI in unterschiedlichen Frameworks (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • Zwei 48-Kern-CPUs schaffen die Geschwindigkeit einer (!) günstigeren Tesla T4. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP alias Xeon Platinum 9200 (Bild: Intel)
  • Im Package sitzen zwei Dies, es wird zudem verlötet statt gesockelt. (Bild: Intel)
  • Die CLX-AP werden als Systeme verkauft. (Bild: Intel)
  • Varianten mit 400 Watt pro CPU sind wassergekühlt. (Bild: Intel)
  • Per Bandbreiten-Zuteilung steigt die Leistung priorisierter Workloads. (Bild: Intel)
  • Speed Select kann Jobs mit mehr Takt versorgen ... (Bild: Intel)
  • ... oder den Basistakt bei weniger Kernen anheben. (Bild: Intel)
  • Die Y-Modelle und die N-Chips beherrschen Speed Select. (Bild: Intel)
  • CLX-AP mit 48 Kernen gegen Vorserien-Epyc mit 64 Kernen (Bild: Golem.de)
  • Leistungszuwachs der Xeon SP v2 zu den Vorgängern (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP und CLS-AP gegen AMDs Epyc mit 32C (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
  • CLX-AP soll die Epyc 7000 durchweg schlagen. (Bild: Intel)
  • Appendix zum vorhergehenden Benchmark (Bild: Intel)
Cascade Lake weist Hardware-Migitationen gegen Meltdown/Spectre auf. (Bild: Intel)

Wie sehr sich diese auf welche Workloads auswirken, variiert: Limitiert die Rechenleistung und finden Berechnungen im User-Space statt, fällt der Geschwindigskeitszuwachs mit 3 bis 8 Prozent eher gering aus. Mit dem FIO-Storage-Benchmark auf einem CPU-Kern bei 100 Prozent Last und kleinen 4-KByte-Dateien hingegen sind es gleich 38 Prozent, was signifikant ist. Interessant ist, dass Intel zufolge für manche Hardware-Mitigationen kein Check-Bit existiert, um die Auswirkungen dediziert zu testen. Daher präsentierte der Hersteller notgedrungen nur einen Vergleich zu den bisherigen Firmware/Software-Ansätzen bei den Skylake SP.

Deep Learning Boost für 56 Kerne 
  1. 1
  2. 2
  3. 3
  4.  


Anzeige
Spiele-Angebote
  1. 4,99€
  2. 2,99€
  3. 1,72€
  4. 1,12€

derdiedas 11. Apr 2019

Was ich festgestellt habe ist das EPYC CPUs die Leistung homogener und zuverlässiger...

das_mav 04. Apr 2019

Interessante Interpretation.

freddx12 03. Apr 2019

Musste lachen. Danke :D

Nigcra 03. Apr 2019

hast du meinen Beitrag überhaupt gelesen? VMware ist nicht das Problem. Es geht um das...

werpu 03. Apr 2019

Was ich damit meine, AMD bietet zum gleichen Zeitpunkt 64 Kerne bei viel weniger...


Folgen Sie uns
       


Sony Xperia 1 - Test

Das Xperia 1 eignet sich dank seines breiten OLED-Displays hervorragend zum Filmeschauen. Im Test zeigt Sonys neues Smartphone aber noch weitere Stärken.

Sony Xperia 1 - Test Video aufrufen
Raumfahrt: Galileo-Satellitennavigation ist vollständig ausgefallen
Raumfahrt
Galileo-Satellitennavigation ist vollständig ausgefallen

Seit Donnerstag senden die Satelliten des Galileo-Systems keine Daten mehr an die Navigationssysteme. SAR-Notfallbenachrichtigungen sollen aber noch funktionieren. Offenbar ist ein Systemfehler in einer Bodenstation die Ursache. Nach fünf Tagen wurde die Störung behoben.


    In eigener Sache: Golem.de bietet Seminar zu TLS an
    In eigener Sache
    Golem.de bietet Seminar zu TLS an

    Der Verschlüsselungsexperte und Golem.de-Redakteur Hanno Böck gibt einen Workshop zum wichtigsten Verschlüsselungsprotokoll im Netz. Am 24. und 25. September klärt er Admins, Pentester und IT-Sicherheitsexperten in Berlin über Funktionsweisen und Gefahren von TLS auf.

    1. In eigener Sache Zweiter Termin für Kubernetes-Seminar
    2. Leserumfrage Wie können wir dich unterstützen?
    3. In eigener Sache Was du schon immer über Kubernetes wissen wolltest

    Transport Fever 2 angespielt: Wachstum ist doch nicht alles
    Transport Fever 2 angespielt
    Wachstum ist doch nicht alles

    Wesentlich mehr Umfang, bessere Übersicht dank neuer Benutzerführung und eine Kampagne mit 18 Missionen: Das Schweizer Entwicklerstudio Urban Games hat Golem.de das Aufbauspiel Transport Fever 2 vorgestellt - bei einer Bahnfahrt.
    Von Achim Fehrenbach

    1. Mordhau angespielt Die mit dem Schwertknauf zuschlagen
    2. Bus Simulator angespielt Zwischen Bodenschwelle und Haltestelle
    3. Bright Memory angespielt Brachialer PC-Shooter aus China

      •  /