Abo
  • Services:
Anzeige
Die-Shot des Power9
Die-Shot des Power9 (Bild: IBM)

Power9: IBMs 24-Kern-Chip kann 8 TByte RAM pro Sockel nutzen

Die-Shot des Power9
Die-Shot des Power9 (Bild: IBM)

Big Blue gegen Intel: Der Power9-Prozessor tritt gegen die Xeon E5/E7 an. Bis zu 24 Kerne mit 8-fachem SMT, Unmengen an Cache, eine moderne Fertigung und einige Zentauren sollen dabei helfen.

IBM hat auf der Hot Chips 28 im kalifornischen Cupertino den Power9 vorgestellt: Die Prozessorreihe umfasst vorerst vier Modelle, um unterschiedliche Märkte adressieren zu können. Generell werden die Power9 im Scale-Out-Segment mit Single- oder Dual-Sockel-Systemen gegen Intels Xeon E5 sowie für das Scale-Up-Umfeld gegen die Xeon E7 positioniert. Dafür braucht es viel Leistung - die Daten sind dementsprechend beeindruckend.

Anzeige

Die vier Varianten nutzen 24 oder 12 Kerne und 4-faches sowie 8-faches Simultaneous Multithreading, was IBM durch unterschiedliche Kerne realisiert: Das Front- wie das Backend sind doppelt ausgelegt, damit die Threads über die nötigen Ressourcen verfügen. Der Unterschied zwischen Scale-Out und Scale-Up besteht in der Speicherbindung: Der Power9 SO hat acht DDR4-Speicherkanäle für theoretisch 4 TByte Speicher, was jedoch 256-GByte-Module voraussetzt. Die Datentransferrate soll bei bis zu 120 GByte die Sekunde liegen.

  • Power-Roadmap (Bild:IBM)
  • Floorplan des Power9 mit 24 Kernen (Bild:IBM)
  • Den Power9 gibt es mit SMT4 und SMT8. (Bild:IBM)
  • Doppeltes SMT meint doppelte Ressourcen (Bild:IBM)
  • Kürzere Pipeline als beim Power8 (Bild:IBM)
  • Überblick der Caches und Ausführungseinheiten pro Kern (Bild:IBM)
  • Die Scale-Up-Variante nutzt Memory Buffer. (Bild:IBM)
  • Benchmarks bei 4 GHz, der Power8 bildet die Basis (Bild:IBM)
  • Per Bluelink können FPGAs und Tesla-Beschleuniger angebunden werden. (Bild:IBM)
Floorplan des Power9 mit 24 Kernen (Bild:IBM)

Beim Power9 SU sitzen acht zusätzliche Centaur-Chips für Buffered Memory auf dem Package, von denen jeder vier statt nur zwei DDR4-2666-Sticks pro Kanal ansprechen kann - das macht 8 TByte pro Sockel. Jeder der Zentauren weist überdies 16 MByte eigenen Speicher auf, was zusammen 128 MByte L4-Cache macht, wie schon beim Power8. Durch die Centaur-Chips lädt der Power9 SU Daten mit bis zu 230 statt mit bis zu 120 GByte pro Sekunde.

Die eigentlichen Kerne sind mit einer kürzeren Pipeline als noch beim Power8 und Power8+ versehen und arbeiten mit der neuen Power ISA v3. Jeder Kern verfügt über je 32 KByte L1-Instruktionen- und L1-Daten- sowie 512 KByte eigenen L2-Cache, hinzu kommen 120 MByte L3-Puffer für alle zusammen. Mit im Chip sitzen 48 PCIe-4.0-Lanes sowie ein Phy, über das der Bluelink (48 x 25 Gbps) angebunden ist. Das ermöglicht den Anschluss von FPGAs via New CAPI oder von Nvidias Tesla P100 per NV Link 1.0 in der Modulversion. Kommende Volta-Karten sollen NV-Link 2.0 in Kombination mit einem Power9 ermöglichen.

  • Power-Roadmap (Bild:IBM)
  • Floorplan des Power9 mit 24 Kernen (Bild:IBM)
  • Den Power9 gibt es mit SMT4 und SMT8. (Bild:IBM)
  • Doppeltes SMT meint doppelte Ressourcen (Bild:IBM)
  • Kürzere Pipeline als beim Power8 (Bild:IBM)
  • Überblick der Caches und Ausführungseinheiten pro Kern (Bild:IBM)
  • Die Scale-Up-Variante nutzt Memory Buffer. (Bild:IBM)
  • Benchmarks bei 4 GHz, der Power8 bildet die Basis (Bild:IBM)
  • Per Bluelink können FPGAs und Tesla-Beschleuniger angebunden werden. (Bild:IBM)
Die Scale-Up-Variante nutzt Memory Buffer. (Bild:IBM)

Gefertigt werden die Power9 in Globalfoundries Fab 8 in Malta, New York im 14HP-Verfahren (14 nm FinFET High Performance mit Silicon-on-Insulator, SOI). Das hatte der Auftragsfertiger samt der Fab 10 in East Fishkill, New York Ende 2014 übernommen. Der größte Power9 weist 17 Metal-Layer und 8 Milliarden Transistoren auf. IBMs eigene Benchmarks sehen den Chip bei gleichem Takt (4 GHz) um den Faktor 1,6x bis 2,3x vor dem Power8.

Im zweiten Halbjahr 2017 will IBM den Power9 für Scale-Out ausliefern, ab 2018 sollen die Scale-Up-Varianten für vier und acht Sockel folgen. Die Gegner werden damit folglich Intels Skylake-EP/EX mit bis zu 28 Kernen.


eye home zur Startseite
ms (Golem.de) 29. Aug 2016

Intel bereits abgeschlagen, Zen bzw Summit Ridge mit 4 GHz - was hab ich verpasst...

HubertHans 28. Aug 2016

Du meinst Kodierungen.



Anzeige

Stellenmarkt
  1. BG-Phoenics GmbH, Hannover
  2. VÖLKL SPORTS GMBH & CO. KG, Straubing, Raum Regensburg / Deggendorf
  3. VITRONIC Dr.-Ing. Stein Bildverarbeitungssysteme GmbH, Wiesbaden
  4. BG-Phoenics GmbH, München


Anzeige
Top-Angebote
  1. (u. a. Laptops, Werkzeuge, Outdoor-Spielzeug, Grills usw.)
  2. (u. a. Bose Soundlink Mini Bluetooth Speaker II 149,90€, Bose SOUNDSPORT PULSE WIRELESS 174,90€)

Folgen Sie uns
       


  1. Hasskommentare

    Bundesrat fordert zahlreiche Änderungen an Maas-Gesetz

  2. GVFS

    Windows-Team nutzt fast vollständig Git

  3. Netzneutralität

    Verbraucherschützer wollen Verbot von Stream On der Telekom

  4. Wahlprogramm

    SPD fordert Anzeigepflicht für "relevante Inhalte" im Netz

  5. Funkfrequenzen

    Bundesnetzagentur und Alibaba wollen Produkte sperren

  6. Elektromobilität

    Qualcomm lädt E-Autos während der Fahrt auf

  7. Microsoft

    Mixer soll schneller streamen als Youtube Gaming und Twitch

  8. Linux

    Kritische Sicherheitslücke in Samba gefunden

  9. Auftragsfertiger

    Samsung erweitert Roadmap bis 4 nm plus EUV

  10. Fake News

    Ägypten blockiert 21 Internetmedien



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Quantencomputer: Nano-Kühlung für Qubits
Quantencomputer
Nano-Kühlung für Qubits
  1. IBM Q Mehr Qubits von IBM
  2. Quantencomputer Was sind diese Qubits?
  3. Verschlüsselung Kryptographie im Quantenzeitalter

XPS 13 (9365) im Test: Dells Convertible zeigt alte Stärken und neue Schwächen
XPS 13 (9365) im Test
Dells Convertible zeigt alte Stärken und neue Schwächen
  1. Schnittstelle Intel pflegt endlich Linux-Treiber für Thunderbolt
  2. Atom C2000 & Kaby Lake Updates beheben Defekt respektive fehlendes HDCP 2.2
  3. UP2718Q Dell verkauft HDR10-Monitor ab Mai 2017

Calliope Mini im Test: Neuland lernt programmieren
Calliope Mini im Test
Neuland lernt programmieren
  1. Arduino Cinque RISC-V-Prozessor und ESP32 auf einem Board vereint
  2. MKRFOX1200 Neues Arduino-Board erscheint mit kostenlosem Datentarif
  3. Creoqode 2048 Tragbare Spielekonsole zum Basteln erhältlich

  1. Re: Funktioniert nur bis 120 km/h

    DAUVersteher | 15:37

  2. Re: DATENVOLUMEN IST MEIST NUR FÜR ILLEGALE INHALTE!

    hackCrack | 15:35

  3. Re: Wieso bitte alles in ein Mega-Repo?

    sg (Golem.de) | 15:33

  4. Re: Die hohen Anschaffungskosten eines E-Autos...

    Sea | 15:32

  5. Re: Volumenbegrenzungen abschaffen

    mannzi | 15:32


  1. 15:15

  2. 13:35

  3. 13:17

  4. 13:05

  5. 12:30

  6. 12:01

  7. 12:00

  8. 11:58


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel