Exynos 9810: Samsungs M3-Kern ist doppelt so groß

Die Meerkat-Cores in Samsungs Exynos 9810 sind riesig, aber auch extrem schnell. Das Design wurde deutlich breiter ausgelegt und die Caches vergrößert, die Latenzen aber sind eine Schwachstelle.

Artikel veröffentlicht am ,
Floorplan eines Clusters mit vier M3-Cores
Floorplan eines Clusters mit vier M3-Cores (Bild: Samsung)

Samsung hat auf der Hot Chips 30 im kalifornischen Cupertino seinen M3-Kern alias Meerkat erläutert. Er folgt auf den M2- und den 2016 besprochenen M1-Core und steckt im Exynos 9810 genannten System-on-a-Chip des Galaxy S9(+) und des Galaxy Note 9. Der Meerkat-Kern wurde von Samsungs Austin R&D Center (SARC) entwickelt und ist ein Custom-Core, der anstelle von ARMs Cortex-Kernen eingesetzt wird. Die Südkoreaner erhofften sich Vorteile bei der Effizienz und der Leistung der eigenen Smartphone-Chips, was mit der Umsetzung des M3-Kerns durchaus gelang.

Stellenmarkt
  1. IT-Softwareingenieur (w/m/d) 1st Level
    SSI SCHÄFER Automation GmbH, Giebelstadt
  2. Test Analyst / Software Test Engineer (m/w/d)
    GK Software SE, Berlin, Chemnitz, Jena, Schöneck, Sankt Ingbert
Detailsuche

Der M1-Core alias Mongoose war ein 14LPP-Design, der M2-Kern sollte eigentlich nur ein Port auf die 10LPE-Fertigung werden, erhielt dann aber einige Verbesserungen aus dem sich schon in Entwicklung befindlichen M3-Ansatz mit 10LPP-Node. Den M2 hat Samsung nie im Detail präsentiert, weshalb der neue M3 primär mit dem M1 verglichen wird. Eine wichtige Änderung ist die Cache-Hierachie. Statt zwei MByte L2-Cache für vier Kerne zusammen hat nun jeder Core seine eignen 512 KByte mit doppelter Bandbreite. Überdies gibt es einen vier MByte großen L3-Cache, wenngleich Samsung keine Dynamiq-Struktur verwendet. Eine Schwachstelle des Designs sind die Latenzen beim L2/L3-Cache, hier ist ein Cortex-A75, wie er im Snapdragon 845 eingesetzt wird, klar flotter.

  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
Präsentation zum M3-Kern (Bild: Samsung)

Mit 17 Stufen statt 15 Stufen ist die Pipeline des M3 tiefer als die des M1, beginnend beim Frontend. Die Sprungvorhersage wurde verbessert, der Decoder schafft sechs anstelle von vier Befehlen und der Re-Order-Buffer des Schedulers hält 228 statt 100 Einträge vor. Die Gleitkomma-Einheit erhält einen dritten Scheduler und drei kombinierte FMAC/FADD-128-Bit-Einheiten statt je eine dedizierte für doppelte Flops, eine zweite Load-Einheit liefert passend dazu mehr Daten an. Die Integer-Einheit verarbeitet neun statt sieben Befehle, hat eine vierte ALU und ebenfalls eine zweite Load-Einheit. Hinzu kommen tiefere Puffer, weniger Taktzyklen für bestimmte Operationen und eine überarbeitete Dividier-Funktion.

In den einzelnen Sub-Tests des Geekbench 4 ist der M3-Kern bei 2,7 GHz mindestens anderthalb Mal bis doppelt so schnell wie der M2-Core bei 2,3 GHz und auch ARMs Cortex-A75 wird mit ähnlichem Abstand abgehängt. Bei gleichem Takt ist der M3 laut Samsung zudem effizienter als der M2 - mit 2,7 GHz auf Kosten der Geschwindigkeit nicht mehr. Ein M3-Core ist mit 2,52 mm² plus 0,98 mm² für 512 KByte L2-Cache dafür aber auch mehr als doppelt so groß wie ein M2-Kern bei recht ähnlicher Fertigungstechnik. Samsung arbeitet bereits am M4, der wird dann gegen ARMs Cortex-A76 antreten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Lumumba 21. Aug 2018

Geekbench is SH*T. It actually seems to have gotten worse with version 3, which you...

sambache 21. Aug 2018

Das Pferd ist vorne hinten als höher



Aktuell auf der Startseite von Golem.de
Telemetrie
Voyager 1 weiß wohl nicht, wo sie ist

Seit 1977 befindet sich die Raumsonde Voyager 1 auf ihrer Reise durchs All. Die neusten Daten scheinen einen falschen Standort anzuzeigen.

Telemetrie: Voyager 1 weiß wohl nicht, wo sie ist
Artikel
  1. Übernahme: Broadcom verhandelt Kauf von VMware
    Übernahme
    Broadcom verhandelt Kauf von VMware

    Eine Übernahme von VMware hätte mindestens ein Volumen von 40 Milliarden US-Dollar. Dell will die Beteiligung verkaufen.

  2. Halbleiterfertigung: Joe Biden bekommt erste 3-nm-Chips gezeigt
    Halbleiterfertigung
    Joe Biden bekommt erste 3-nm-Chips gezeigt

    Bei einem Amtsbesuch in Südkorea hat US-Präsident Joe Biden auch eine Fab von Samsung Foundry besucht und die neue 3-nm-Technik gelobt.

  3. Kubernetes-Kontrollcenter: Mit YTT-Templates Kubernetes-Cluster besser verwalten
    Kubernetes-Kontrollcenter
    Mit YTT-Templates Kubernetes-Cluster besser verwalten

    Wir zeigen, wie man mit zentraler und automatisierter YAML-Generierung Hunderte Microservices spielend verwalten kann.
    Eine Anleitung von Jochen R. Meyer

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (u. a. AMD Ryzen 9 5950X 488€, MSI RTX 3090 Gaming X Trio 1.799€) • Cyber Week: Jetzt alle Deals freigeschaltet • LG OLED TV 77" 62% günstiger: 1.749€ • Bis zu 35% auf MSI • Alternate (u. a. AKRacing Core EX SE Gaming-Stuhl 169€) [Werbung]
    •  /