Abo
  • Services:
Anzeige
Naples: 32C/64T und 8 Memory-Channels
Naples: 32C/64T und 8 Memory-Channels (Bild: AMD)

Naples-Prozessor: Wie AMD Intel im Serversegment übertrumpfen will

Naples: 32C/64T und 8 Memory-Channels
Naples: 32C/64T und 8 Memory-Channels (Bild: AMD)

Mit 32 Kernen und acht Speicherkanälen ist Naples ein Chip, den AMD als Hoffnungsträger bezeichnet: Die Zen-basierten Server-CPUs werden in 2-Sockel-Systemen gegen Intels Xeon E5 v4 (Broadwell-EP) und später gegen die Xeon E5 v5 (Skylake-EP) positioniert und sollen zumindest deutlich besser sein als die erstgenannten Prozessoren.

Mit dem Ryzen 7 1800X hat AMD vor wenigen Tagen einen Prozessor veröffentlicht, der wie die weiteren Ryzen-Modelle den Desktop-Umsatz des Herstellers steigern dürfte. Der Consumer-Markt allerdings ist längst nicht so lukrativ wie die Serversparte, in der AMD mit einem Marktanteil von rund 1 Prozent seit Jahren praktisch keine Rolle mehr spielt. Das soll sich künftig ändern: Unter dem Codenamen Naples wurde ein Serverchip entwickelt, dessen Auslieferung im zweiten Quartal 2017 beginnt. Spätestens ab dem kommenden Jahr, das sagte CTO Mark Papermaster, sollen die CPUs für einen zweistelligen Marktanteil sorgen.

Anzeige

Um das zu erreichen, zielt AMD auf 2-Sockel-Systeme ab, welche im Serverbereich mit großem Abstand am weitesten verbreitet sind. 4- und 8-Sockel-Plattformen wie IBMs Power9 oder Intels Xeon E7 v4 stellen eine extrem teure Minderheit für Nischenmärkte dar, die AMD vorerst nicht bedienen will und kann. Naples unterstützt zwar einzig 2-Sockel-Systeme, ist in diesem Segment jedoch auf absehbare Zeit einer der mächtigsten Prozessoren überhaupt und könnte bis auf Ausnahmen selbst für Intels kommende Skylake-EP-Generation einen ernstzunehmenden Gegner darstellen. Funktionen wie eine Speicherverschlüsselung (SME, Secure Memory Encryption) plus Secure Encrypted Virtualization (SVE) entsprechen den Secure Guard Extensions (SGX) von Intel, auch hier hat AMD aufgeholt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)

Die Naples-CPUs basieren auf der gleichen Zen-Mikroarchitektur wie die Ryzen-Chips für Desktoprechner, sie weisen aber bis zu 32 statt 8 Kerne auf. Auch wenn es AMD in den offiziellen Sessions nicht direkt bestätigen wollte, besteht Naples aus vier Dies: Auf einer Folie ist explizit von 8 x 16 PCIe-Lanes bei einem 2-Sockel-System die Rede, was mit dem übereinstimmt, was wir schon seit Monaten immer wieder mitbekommen. Die Chips sind per Infinity Fabric auf einem Träger verbunden, es handelt sich also um zwei MCMs (Multi Chip Modules) und somit um insgesamt acht der sogenannten Zeppelin-Dies.

Es liegt die Vermutung nahe, dass es sich um die gleichen Dies wie bei Ryzen handelt, die Chips also mit der gleichen Maske hergestellt und aus den gleichen Wafern geschnitten werden. Dass jedes Die ein Dualchannel-Interface nutzt und jeder Naples ein Octachannel-Interface, stützt die Quad-MCM-These. Obendrein hat AMD viel Erfahrung mit MCMs, schon die älteren Magny-Cours- (K10.5) und Interlagos-CPUs (Bulldozer) sind aus zwei Dies zusammengesetzte Prozessoren mit 8 sowie 16 Kernen. Folglich stecken in Naples auch Ethernet- Sata- und USB-Ports, da es sich um ein SoC handelt. Details nannte AMD nicht.

Von den 128 PCIe-Gen3-Lanes, die je ein Naples-Chip aufweist, wird allerdings die Hälfte verwendet, um die beiden Prozessoren in einem 2-Sockel-System über je 64 Bahnen per erweitertem Hypertransport miteinander kommunizieren zu lassen. Dennoch beeindruckt die Plattform: Sie verfügt über 64 Kerne und dank SMT über 128 Threads, hinzu kommen 128 PCIe-Lanes für Beschleuniger wie die Radeon Instinct und 16 Speicherkanäle, von denen jeder zwei Module mit DDR4-2400-Geschwindigkeit oder eines mit DDR4-2667 ansprechen kann. Das ermöglicht eine Kapazität von einem halben Terabyte, wenn 16-GByte-DIMMs zum Einsatz kommen. Mit größeren Modulen sind 4 TByte das Limit, ECC sowie NVDIMMs werden unterstützt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)

Intels aktuelle Broadwell-EP-Generation alias Xeon E5-2600 v5 ist als 2-Sockel-System bestehend aus zwei Xeon E5-2699A v4 mit 44 Kernen, 88 Threads, 80 PCIe-Gen3-Lanes und acht Speicherkanälen mit je drei DIMMs für 384 GByte Speicher (DDR4-1866) klar schlechter ausgestattet. Um dennoch zu zeigen, dass sich AMDs Zen-Architektur pro Kern nicht verstecken muss, verglich der Hersteller die Berechnung einer seismischen Analyse mit einem 2-Sockel-Naples-System, das auf 88 Threads - bei weiterhin 16 Speicherkanälen - und langsameren Speicher (1,866 statt 2,400) limitiert wurde. Zum CPU-Takt verriet AMD nichts, ein AVX-Offset wie bei Intel scheint aber zu fehlen.

Mit einer Milliarde Samples als Input erledigte die Naples-Plattform die Berechnung doppelt so schnell, mit vollen 64 Kernen und 128 Threads sowie DDR4-2400 zweieinhalb mal so flott. Wird die Anzahl der Input-Samples auf vier Milliarden erhöht, verweigert das Intel-System den Dienst, da die Speicherkapazität nicht ausreicht, sie zu laden. In diesem ausgewählten, sehr bandbreitenlastigen Szenario schlägt sich Naples also exzellent, obgleich die Berechnung auf AVX-Code setzt, der bei Zen mit weniger Durchsatz abgearbeitet wird als bei Broadwell. Ein Grund dafür ist laut AMD die nahezu perfekte Skalierung von einem auf zwei Sockel dank Infinity Fabric, was bei Intels Broadwell-EP-Familie nicht der Fall sei.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)

Ein paar Wochen oder Monate nach Naples erscheint allerdings die Skylake-EP-Generation, die Intel bereits an einige wenige Partner wie Facebook und Google verteilt hat. Die Prozessoren nutzen als 2-Sockel-Plattform 56 Kerne, 12 statt 8 Speicherkanäle, flotteren RAM und 88 statt 80 Lanes. Hinzu kommt eine verbesserte Architektur mit überarbeitetem Cache-System und AVX512-Unterstützung. AMD gab sich zurückhaltend optimistisch: Wie sich Naples gegen eine noch nicht veröffentlichte Plattform schlage, könne nicht bewertet werden. Es ist aber davon auszugehen, dass der Hersteller im Bilde ist.

Schlussendlich gibt es zu viele unbekannte Faktoren, um einschätzen zu können, ob Naples ein Erfolg wird - wenngleich die Zeichen erstmals seit Jahren wieder gut stehen. Für AMD entscheidet vor allem dieser Chip darüber, wie es um die Zukunft des Unternehmens bestellt ist.

Nachtrag vom 8. März 2017, 7:00 Uhr

In einer zusätzlichen Folie aus Mark Papermasters Präsentation vom Tech Day spricht AMD bei Naples mit 32 Kernen von einem Package und vier Chips (1P Dies).


eye home zur Startseite
ms (Golem.de) 07. Mär 2017

Allzu tief ging AMD bisher nicht, abseits von High Bandwidth bei Low Latency in Form von...

David64Bit 07. Mär 2017

Deswegen ist er wahrscheinlich auch überall ausverkauft bzw. alle Mainboards sind...

cb (Golem.de) 07. Mär 2017

So, jetzt ist hoffentlich alles wieder an seinem Platz. Wir bitten für den Fehler um...



Anzeige

Stellenmarkt
  1. Bertrandt Technikum GmbH, Ehningen bei Stuttgart
  2. Schwarz IT Infrastructure & Operations Services GmbH & Co. KG, Neckarsulm
  3. Deutsches Krebsforschungszentrum Abt. Personal- und Sozialwesen (M210), Heidelberg
  4. Robert Bosch GmbH, Stuttgart


Anzeige
Spiele-Angebote
  1. 119,99€ (Vorbesteller-Preisgarantie)
  2. 10% Rabatt auf ausgewählte Top Gaming Artikel mit dem Gutscheincode: PICKYOURLOOT
  3. 1,49€

Folgen Sie uns
       


  1. Android-App für Raspberry programmieren

    werGoogelnKann (kann auch Java)

  2. Aldebaran Robotics

    Roboter Pepper soll bei Beerdigungen in Japan auftreten

  3. Google Express

    Google und Walmart gehen Shopping-Kooperation ein

  4. Firmen-Shuttle

    Apple baut autonomes Auto - aber nicht für jeden

  5. Estcoin

    Estland könnte eigene Kryptowährung erschaffen

  6. Chrome Enterprise

    Neues Abomodell soll Googles Chrome OS in Firmen etablieren

  7. Blue Byte

    Anno 1800 mit Straßenschlachten und dicker Luft

  8. aCar

    Elektrolaster für Afrika entsteht in München

  9. Logitech Powerplay im Test

    Die niemals leere Funk-Maus

  10. Elektroroller

    Einstieg in die Elektromobilität ab 2.000 Euro



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Orange Pi 2G IoT ausprobiert: Wir bauen uns ein 20-Euro-Smartphone
Orange Pi 2G IoT ausprobiert
Wir bauen uns ein 20-Euro-Smartphone
  1. Odroid HC-1 Bastelrechner besser stapeln im NAS
  2. Bastelrechner Nano Pi im Test Klein, aber nicht unbedingt oho

Mitmachprojekt: HTTPS vermiest uns den Wetterbericht
Mitmachprojekt
HTTPS vermiest uns den Wetterbericht

Google Home auf Deutsch im Test: "Tut mir leid, ich verstehe das nicht"
Google Home auf Deutsch im Test
"Tut mir leid, ich verstehe das nicht"
  1. Smarter Lautsprecher Google Home erhält Bluetooth-Zuspielung und Spotify Free
  2. Kompatibilität mit Sprachassistenten Trådfri-Update kommt erst im Herbst
  3. Lautsprecher-Assistent Google Home ab 8. August 2017 in Deutschland erhältlich

  1. Re: Komplett

    My2Cents | 11:59

  2. Re: E-Roller für Führerschein A1

    logged_in | 11:59

  3. Re: +1 (k.T.)

    ssj3rd | 11:59

  4. Re: Nächster logischer Schritt:

    buuii | 11:58

  5. Re: Ich frage mich eher warum die immer noch 2000...

    Azzuro | 11:58


  1. 12:05

  2. 12:00

  3. 11:52

  4. 11:27

  5. 11:03

  6. 10:48

  7. 10:00

  8. 09:33


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel