Abo
  • Services:
Anzeige
Naples: 32C/64T und 8 Memory-Channels
Naples: 32C/64T und 8 Memory-Channels (Bild: AMD)

Naples-Prozessor: Wie AMD Intel im Serversegment übertrumpfen will

Naples: 32C/64T und 8 Memory-Channels
Naples: 32C/64T und 8 Memory-Channels (Bild: AMD)

Mit 32 Kernen und acht Speicherkanälen ist Naples ein Chip, den AMD als Hoffnungsträger bezeichnet: Die Zen-basierten Server-CPUs werden in 2-Sockel-Systemen gegen Intels Xeon E5 v4 (Broadwell-EP) und später gegen die Xeon E5 v5 (Skylake-EP) positioniert und sollen zumindest deutlich besser sein als die erstgenannten Prozessoren.

Mit dem Ryzen 7 1800X hat AMD vor wenigen Tagen einen Prozessor veröffentlicht, der wie die weiteren Ryzen-Modelle den Desktop-Umsatz des Herstellers steigern dürfte. Der Consumer-Markt allerdings ist längst nicht so lukrativ wie die Serversparte, in der AMD mit einem Marktanteil von rund 1 Prozent seit Jahren praktisch keine Rolle mehr spielt. Das soll sich künftig ändern: Unter dem Codenamen Naples wurde ein Serverchip entwickelt, dessen Auslieferung im zweiten Quartal 2017 beginnt. Spätestens ab dem kommenden Jahr, das sagte CTO Mark Papermaster, sollen die CPUs für einen zweistelligen Marktanteil sorgen.

Anzeige

Um das zu erreichen, zielt AMD auf 2-Sockel-Systeme ab, welche im Serverbereich mit großem Abstand am weitesten verbreitet sind. 4- und 8-Sockel-Plattformen wie IBMs Power9 oder Intels Xeon E7 v4 stellen eine extrem teure Minderheit für Nischenmärkte dar, die AMD vorerst nicht bedienen will und kann. Naples unterstützt zwar einzig 2-Sockel-Systeme, ist in diesem Segment jedoch auf absehbare Zeit einer der mächtigsten Prozessoren überhaupt und könnte bis auf Ausnahmen selbst für Intels kommende Skylake-EP-Generation einen ernstzunehmenden Gegner darstellen. Funktionen wie eine Speicherverschlüsselung (SME, Secure Memory Encryption) plus Secure Encrypted Virtualization (SVE) entsprechen den Secure Guard Extensions (SGX) von Intel, auch hier hat AMD aufgeholt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)

Die Naples-CPUs basieren auf der gleichen Zen-Mikroarchitektur wie die Ryzen-Chips für Desktoprechner, sie weisen aber bis zu 32 statt 8 Kerne auf. Auch wenn es AMD in den offiziellen Sessions nicht direkt bestätigen wollte, besteht Naples aus vier Dies: Auf einer Folie ist explizit von 8 x 16 PCIe-Lanes bei einem 2-Sockel-System die Rede, was mit dem übereinstimmt, was wir schon seit Monaten immer wieder mitbekommen. Die Chips sind per Infinity Fabric auf einem Träger verbunden, es handelt sich also um zwei MCMs (Multi Chip Modules) und somit um insgesamt acht der sogenannten Zeppelin-Dies.

Es liegt die Vermutung nahe, dass es sich um die gleichen Dies wie bei Ryzen handelt, die Chips also mit der gleichen Maske hergestellt und aus den gleichen Wafern geschnitten werden. Dass jedes Die ein Dualchannel-Interface nutzt und jeder Naples ein Octachannel-Interface, stützt die Quad-MCM-These. Obendrein hat AMD viel Erfahrung mit MCMs, schon die älteren Magny-Cours- (K10.5) und Interlagos-CPUs (Bulldozer) sind aus zwei Dies zusammengesetzte Prozessoren mit 8 sowie 16 Kernen. Folglich stecken in Naples auch Ethernet- Sata- und USB-Ports, da es sich um ein SoC handelt. Details nannte AMD nicht.

Von den 128 PCIe-Gen3-Lanes, die je ein Naples-Chip aufweist, wird allerdings die Hälfte verwendet, um die beiden Prozessoren in einem 2-Sockel-System über je 64 Bahnen per erweitertem Hypertransport miteinander kommunizieren zu lassen. Dennoch beeindruckt die Plattform: Sie verfügt über 64 Kerne und dank SMT über 128 Threads, hinzu kommen 128 PCIe-Lanes für Beschleuniger wie die Radeon Instinct und 16 Speicherkanäle, von denen jeder zwei Module mit DDR4-2400-Geschwindigkeit oder eines mit DDR4-2667 ansprechen kann. Das ermöglicht eine Kapazität von einem halben Terabyte, wenn 16-GByte-DIMMs zum Einsatz kommen. Mit größeren Modulen sind 4 TByte das Limit, ECC sowie NVDIMMs werden unterstützt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)

Intels aktuelle Broadwell-EP-Generation alias Xeon E5-2600 v5 ist als 2-Sockel-System bestehend aus zwei Xeon E5-2699A v4 mit 44 Kernen, 88 Threads, 80 PCIe-Gen3-Lanes und acht Speicherkanälen mit je drei DIMMs für 384 GByte Speicher (DDR4-1866) klar schlechter ausgestattet. Um dennoch zu zeigen, dass sich AMDs Zen-Architektur pro Kern nicht verstecken muss, verglich der Hersteller die Berechnung einer seismischen Analyse mit einem 2-Sockel-Naples-System, das auf 88 Threads - bei weiterhin 16 Speicherkanälen - und langsameren Speicher (1,866 statt 2,400) limitiert wurde. Zum CPU-Takt verriet AMD nichts, ein AVX-Offset wie bei Intel scheint aber zu fehlen.

Mit einer Milliarde Samples als Input erledigte die Naples-Plattform die Berechnung doppelt so schnell, mit vollen 64 Kernen und 128 Threads sowie DDR4-2400 zweieinhalb mal so flott. Wird die Anzahl der Input-Samples auf vier Milliarden erhöht, verweigert das Intel-System den Dienst, da die Speicherkapazität nicht ausreicht, sie zu laden. In diesem ausgewählten, sehr bandbreitenlastigen Szenario schlägt sich Naples also exzellent, obgleich die Berechnung auf AVX-Code setzt, der bei Zen mit weniger Durchsatz abgearbeitet wird als bei Broadwell. Ein Grund dafür ist laut AMD die nahezu perfekte Skalierung von einem auf zwei Sockel dank Infinity Fabric, was bei Intels Broadwell-EP-Familie nicht der Fall sei.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)

Ein paar Wochen oder Monate nach Naples erscheint allerdings die Skylake-EP-Generation, die Intel bereits an einige wenige Partner wie Facebook und Google verteilt hat. Die Prozessoren nutzen als 2-Sockel-Plattform 56 Kerne, 12 statt 8 Speicherkanäle, flotteren RAM und 88 statt 80 Lanes. Hinzu kommt eine verbesserte Architektur mit überarbeitetem Cache-System und AVX512-Unterstützung. AMD gab sich zurückhaltend optimistisch: Wie sich Naples gegen eine noch nicht veröffentlichte Plattform schlage, könne nicht bewertet werden. Es ist aber davon auszugehen, dass der Hersteller im Bilde ist.

Schlussendlich gibt es zu viele unbekannte Faktoren, um einschätzen zu können, ob Naples ein Erfolg wird - wenngleich die Zeichen erstmals seit Jahren wieder gut stehen. Für AMD entscheidet vor allem dieser Chip darüber, wie es um die Zukunft des Unternehmens bestellt ist.

Nachtrag vom 8. März 2017, 7:00 Uhr

In einer zusätzlichen Folie aus Mark Papermasters Präsentation vom Tech Day spricht AMD bei Naples mit 32 Kernen von einem Package und vier Chips (1P Dies).


eye home zur Startseite
ms (Golem.de) 07. Mär 2017

Allzu tief ging AMD bisher nicht, abseits von High Bandwidth bei Low Latency in Form von...

David64Bit 07. Mär 2017

Deswegen ist er wahrscheinlich auch überall ausverkauft bzw. alle Mainboards sind...

cb (Golem.de) 07. Mär 2017

So, jetzt ist hoffentlich alles wieder an seinem Platz. Wir bitten für den Fehler um...



Anzeige

Stellenmarkt
  1. AVS GmbH Datamanagement & Customer Care, Bayreuth
  2. Ratbacher GmbH, Stuttgart
  3. über Hanseatisches Personalkontor Bremen, Großraum Bremen
  4. Schwarz Business IT GmbH & Co. KG, Neckarsulm


Anzeige
Blu-ray-Angebote
  1. (u. a. Hobbit Trilogie Blu-ray 43,89€ und Batman Dark Knight Trilogy Blu-ray 17,99€)
  2. 13,98€ + 5,00€ Versand
  3. (u. a. The Big Bang Theory, The Vampire Diaries, True Detective)

Folgen Sie uns
       


  1. Kupfer

    Nokia hält Terabit DSL für überflüssig

  2. Kryptowährung

    Bitcoin notiert auf neuem Rekordhoch

  3. Facebook

    Dokumente zum Umgang mit Sex- und Gewaltinhalten geleakt

  4. Arduino Cinque

    RISC-V-Prozessor und ESP32 auf einem Board vereint

  5. Schatten des Krieges angespielt

    Wir stürmen Festungen! Mit Orks! Und Drachen!

  6. Skills

    Amazon lässt Alexa natürlicher klingen

  7. Cray

    Rechenleistung von Supercomputern in der Cloud mieten

  8. Streaming

    Sky geht gegen Stream4u.tv und Hardwareanbieter vor

  9. Tado im Langzeittest

    Am Ende der Heizperiode

  10. Owncloud-Fork

    Nextcloud 12 skaliert Global



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Blackberry Keyone im Test: Tolles Tastatur-Smartphone hat zu kurze Akkulaufzeit
Blackberry Keyone im Test
Tolles Tastatur-Smartphone hat zu kurze Akkulaufzeit
  1. Blackberry Keyone kommt Mitte Mai
  2. Keyone Blackberrys neues Tastatur-Smartphone kommt später
  3. Blackberry Keyone im Hands on Android-Smartphone mit toller Hardware-Tastatur

The Surge im Test: Frust und Feiern in der Zukunft
The Surge im Test
Frust und Feiern in der Zukunft
  1. Wirtschaftssimulation Pizza Connection 3 wird gebacken
  2. Mobile-Games-Auslese Untote Rundfahrt und mobiles Seemannsgarn
  3. Spielebranche Beschäftigtenzahl in der deutschen Spielebranche sinkt

Redmond Campus Building 87: Microsofts Area 51 für Hardware
Redmond Campus Building 87
Microsofts Area 51 für Hardware
  1. Windows on ARM Microsoft erklärt den kommenden x86-Emulator im Detail
  2. Azure Microsoft betreut MySQL und PostgreSQL in der Cloud
  3. Microsoft Azure bekommt eine beeindruckend beängstigende Video-API

  1. Was denkt Ihr ist das im Auto okay?

    JoJo778 | 17:40

  2. Re: "Tablets werden sich auch nicht durchsetzen"

    Stefan99 | 17:39

  3. Re: 25MBit/s - wann begreifen die endlich, dass...

    Sharra | 17:38

  4. Re: Bitte nicht vergessen ...

    Hotohori | 17:37

  5. WLAN-Kabel

    Earan | 17:37


  1. 16:35

  2. 16:20

  3. 16:00

  4. 15:37

  5. 15:01

  6. 13:34

  7. 13:19

  8. 12:31


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel