Abo
  • Services:

Phytium Mars: Chinesischer Riesenchip besteht aus 64 ARM-Kernen

Riesige 640 mm²-Chipfläche: Das chinesische Startup Phytium arbeitet an einem ARM-Serverprozessor mit 64 CPU-Kernen. Sollte das ambitionierte Projekt gelingen, wäre es absolut konkurrenzfähig.

Artikel veröffentlicht am ,
Blockdiagramm der Mars-CPU
Blockdiagramm der Mars-CPU (Bild: Phytium)

Das chinesische Startup Phytium hat auf der Technologietagung Hot Chips 27 einen ausführlichen Überblick zu einem neuen Serverprozessor namens Mars gegeben. Darin stecken 64 Kerne mit ARMv8-Architektur, weshalb der Chip schnell und vor allem effizient arbeiten soll. Kleine Anekdote: Charles Zhang von Phytium musste per Telefon zugeschaltet werden, da die USA ihm die Einreise verweigerten, und die Audiopräsentation zu groß für den E-Mailserver war.

Stellenmarkt
  1. TÜV SÜD Gruppe, München
  2. OC Oerlikon, München, Remscheid

Phytium wurde 2012 gegründet, Mars ist das erste Projekt der Chinesen und für den HPC-Mark (High Performance Computing). Es ähnelt von der Idee her den X-Gene von Applied Micro und den ThunderX von Cavium: Insgesamt 64 Xiaomi (übersetzt: Reiskorn) genannte CPU-Kerne mit ARMv8-Architektur stecken in einem Mesh-Netzwerk. Das ist in Panels unterteilt, jedes enthält acht Kerne samt Caches. Der L1-Instruktionen- und der L1-Daten-Puffer fassen jeweils 32 KByte, hinzu kommen 32 MByte L2-Cache pro Panel und eine dritte, gemeinsam genutzte Puffer-Stufe mit 128 MByte für alle CPU-Kerne zusammen.

  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
Details zur Mars-CPU (Bild: Phytium)

Anders als Intel bei Skylake sprach Phytium über die technischen Besonderheiten der Xiaomi-Kerne: Das Frontend kann vier Befehle pro Takt dekodieren, die über die gleiche Anzahl an Scheduler-Ports an das Backend weitergegeben werden. Dort rechnen vier Integer- und eine Gleitkomma-Einheit, letztere benötigt sechs Takte für eine FMA-Operation. Die Latenz der Mesh-Kommunikation beträgt durchschnittlich neun Takte (3 bis 15), die CPU-Kerne im Mars-Prozessor laufen mit 2 GHz.

Auf dem Papier liefern sie eine DP-Leistung (doppelte Genauigkeit) von 512 Gflops, also vier DP-Flops pro Takt und Kern. Daten erhalten die Panels von je zwei 32 Bit breiten DDR3-1600-Speichercontrollern, was bei aufaddiert 128 Kanälen eine theoretische Datentransferrate von 204 GByte pro Sekunde bedeutet, wenn alle Panels parallel angesprochen werden. Das zeigt der Stream-Triad-Benchmark auf, der erst ab zwei Panels (mehr als acht Kerne) skaliert.

  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
  • Details zur Mars-CPU (Bild: Phytium)
Details zur Mars-CPU (Bild: Phytium)

Rein von der Geschwindigkeit steht der Mars-Prozessor für ein Single-Sockel-System sehr gut da: Bei den Multithread-Benchmarks SPECint_2006_rate erreicht der Mars-Chip 585 (Float) und 672 (Integer). Ein einzelner Xeon E5-2695 v3 (Haswell-EP) mit 14 Kernen schafft 410 und 557. Der Mars-Chip soll wie der Xeon 120 Watt benötigen, obgleich er in einem 28-nm-Verfahren (vermutlich bei TSMC) gefertigt wird. Das resultiert in einer Die-Fläche von satten 640 mm². Ähnlich groß sind IBMs Power8 und Intels Xeon Phi Knights Landing und Haswell-EX sowie einige ältere Prozessoren.

Phytium arbeitet auch an einem Earth genannten Chip, der auf einer Folie auftauchte - Zhang wollte darüber aber nicht sprechen. Ebenfalls keinen Kommentar gab es zum Erscheinungstermin des Mars-Prozessor. Ein möglicher Konkurrent wäre Applied Micros X-Gene 3, der mit bis zu 64 Kernen mit 3 GHz antreten soll. Caviums ThunderX setzt derzeit auf 48 Kerne bei 95 Watt.



Anzeige
Spiele-Angebote
  1. 32,99€
  2. (-70%) 17,99€
  3. 32,49€
  4. 49,86€

ichbinsmalwieder 25. Aug 2015

Doch natürlich. Es sei denn Apple hat Prozessorkerne entsprechend schützen lassen...


Folgen Sie uns
       


Samsung Galaxy Watch Active - Hands on

Samsungs neue Smartwatch Galaxy Watch Active richtet sich an sportliche Nutzer. Auf eine drehbare Lünette wie bei den Vorgängermodellen müssen Käufer aber verzichten.

Samsung Galaxy Watch Active - Hands on Video aufrufen
Geforce GTX 1660 im Test: Für 230 Euro eine faire Sache
Geforce GTX 1660 im Test
Für 230 Euro eine faire Sache

Die Geforce GTX 1660 - ohne Ti am Ende - rechnet so flott wie AMDs Radeon RX 590 und kostet in etwa das Gleiche. Der klare Vorteil der Nvidia-Grafikkarte ist die drastisch geringere Leistungsaufnahme.

  1. Nvidia Turing OBS unterstützt Encoder der Geforce RTX
  2. Geforce GTX 1660 Ti im Test Nvidia kann Turing auch günstig(er)
  3. Turing-Grafikkarten Nvidias Geforce 1660/1650 erscheint im März

Zotac Geforce GTX 1660 Ti im Test: Gute 1440p-Karte für unter 300 Euro
Zotac Geforce GTX 1660 Ti im Test
Gute 1440p-Karte für unter 300 Euro

Die Geforce GTX 1660 Ti von Zotac ist eine der günstigen Grafikkarten mit Nvidias Turing-Architektur, dennoch erhalten Käufer ein empfehlenswertes Modell: Der leise Pixelbeschleuniger rechnet praktisch so flott wie übertaktete Modelle, braucht aber weniger Energie.
Ein Test von Marc Sauter

  1. Grafikkarte Chip der Geforce GTX 1660 Ti ist überraschend groß
  2. Deep Learning Supersampling Nvidia will DLSS-Kantenglättung verbessern
  3. Metro Exodus im Technik-Test Richtiges Raytracing rockt

Chrome OS Crostini angesehen: Dieses Nerd-Unix läuft wie geschnitten Brot
Chrome OS Crostini angesehen
Dieses Nerd-Unix läuft wie geschnitten Brot

Mit Crostini bringt Google nun auch eine echte Linux-Umgebung auf Chromebooks, die dafür eigentlich nie vorgesehen waren. Google kann dafür auf ein echtes Linux-System und sehr viel Erfahrung zurückgreifen. Der Nutzung als Entwicklerkiste steht damit fast nichts mehr im Weg.
Von Sebastian Grüner

  1. Google Chromebooks bekommen virtuelle Arbeitsflächen
  2. Crostini VMs in Chromebooks bekommen GPU-Beschleunigung
  3. Crostini Linux-Apps für ChromeOS kommen für andere Distributionen

    •  /