Exynos 9810: Samsungs M3-Kern ist doppelt so groß

Die Meerkat-Cores in Samsungs Exynos 9810 sind riesig, aber auch extrem schnell. Das Design wurde deutlich breiter ausgelegt und die Caches vergrößert, die Latenzen aber sind eine Schwachstelle.

Artikel veröffentlicht am ,
Floorplan eines Clusters mit vier M3-Cores
Floorplan eines Clusters mit vier M3-Cores (Bild: Samsung)

Samsung hat auf der Hot Chips 30 im kalifornischen Cupertino seinen M3-Kern alias Meerkat erläutert. Er folgt auf den M2- und den 2016 besprochenen M1-Core und steckt im Exynos 9810 genannten System-on-a-Chip des Galaxy S9(+) und des Galaxy Note 9. Der Meerkat-Kern wurde von Samsungs Austin R&D Center (SARC) entwickelt und ist ein Custom-Core, der anstelle von ARMs Cortex-Kernen eingesetzt wird. Die Südkoreaner erhofften sich Vorteile bei der Effizienz und der Leistung der eigenen Smartphone-Chips, was mit der Umsetzung des M3-Kerns durchaus gelang.

Der M1-Core alias Mongoose war ein 14LPP-Design, der M2-Kern sollte eigentlich nur ein Port auf die 10LPE-Fertigung werden, erhielt dann aber einige Verbesserungen aus dem sich schon in Entwicklung befindlichen M3-Ansatz mit 10LPP-Node. Den M2 hat Samsung nie im Detail präsentiert, weshalb der neue M3 primär mit dem M1 verglichen wird. Eine wichtige Änderung ist die Cache-Hierachie. Statt zwei MByte L2-Cache für vier Kerne zusammen hat nun jeder Core seine eignen 512 KByte mit doppelter Bandbreite. Überdies gibt es einen vier MByte großen L3-Cache, wenngleich Samsung keine Dynamiq-Struktur verwendet. Eine Schwachstelle des Designs sind die Latenzen beim L2/L3-Cache, hier ist ein Cortex-A75, wie er im Snapdragon 845 eingesetzt wird, klar flotter.

  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
  • Präsentation zum M3-Kern (Bild: Samsung)
Präsentation zum M3-Kern (Bild: Samsung)

Mit 17 Stufen statt 15 Stufen ist die Pipeline des M3 tiefer als die des M1, beginnend beim Frontend. Die Sprungvorhersage wurde verbessert, der Decoder schafft sechs anstelle von vier Befehlen und der Re-Order-Buffer des Schedulers hält 228 statt 100 Einträge vor. Die Gleitkomma-Einheit erhält einen dritten Scheduler und drei kombinierte FMAC/FADD-128-Bit-Einheiten statt je eine dedizierte für doppelte Flops, eine zweite Load-Einheit liefert passend dazu mehr Daten an. Die Integer-Einheit verarbeitet neun statt sieben Befehle, hat eine vierte ALU und ebenfalls eine zweite Load-Einheit. Hinzu kommen tiefere Puffer, weniger Taktzyklen für bestimmte Operationen und eine überarbeitete Dividier-Funktion.

In den einzelnen Sub-Tests des Geekbench 4 ist der M3-Kern bei 2,7 GHz mindestens anderthalb Mal bis doppelt so schnell wie der M2-Core bei 2,3 GHz und auch ARMs Cortex-A75 wird mit ähnlichem Abstand abgehängt. Bei gleichem Takt ist der M3 laut Samsung zudem effizienter als der M2 - mit 2,7 GHz auf Kosten der Geschwindigkeit nicht mehr. Ein M3-Core ist mit 2,52 mm² plus 0,98 mm² für 512 KByte L2-Cache dafür aber auch mehr als doppelt so groß wie ein M2-Kern bei recht ähnlicher Fertigungstechnik. Samsung arbeitet bereits am M4, der wird dann gegen ARMs Cortex-A76 antreten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
5.000 Fahrzeuge pro Woche
Tesla steigert Giga-Berlin-Produktion und lockt mit Rabatten

Tesla hat Ende März 2023 einen wöchentlichen Ausstoß von 5.000 Fahrzeugen erreicht. Derweil sollen Sonderrabatte Kunden locken.

5.000 Fahrzeuge pro Woche: Tesla steigert Giga-Berlin-Produktion und lockt mit Rabatten
Artikel
  1. Fused Deposition Modeling: Käsekuchen in 3D aus sieben Zutaten gedruckt
    Fused Deposition Modeling
    Käsekuchen in 3D aus sieben Zutaten gedruckt

    3D-Druck in der Küche: US-Forschern ist es nach mehreren erfolglosen Versuchen gelungen, ein Stück Käsekuchen auszudrucken.

  2. Verbrennerverbot: So kann die E-Fuels-Regelung noch scheitern
    Verbrennerverbot
    So kann die E-Fuels-Regelung noch scheitern

    Zwar haben sich Regierung und EU-Kommission auf ein Verfahren zur Zulassung von E-Fuel-Autos geeinigt. Doch dieses muss noch einige Hürden überwinden.

  3. Smart-Home-Anwendung: MQTT unter Java nutzen
    Smart-Home-Anwendung
    MQTT unter Java nutzen

    Wer Daten von Sensoren oder ähnlichen Quellen von A nach B senden möchte, kann das Protokoll MQTT verwenden, dank entsprechender Bibliotheken auch einfach unter Java.
    Eine Anleitung von Florian Bottke

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MediaMarkt-Osterangebote • 3 Spiele kaufen, 2 zahlen • Cyberport Jubiläums-Deals • Alternate: Corsair Vengeance 32 GB DDR-6000 116,89€ u. 64 GB DDR-5600 165,89€ • MindStar: AMD Ryzen 7 5800X 209€ • MSI Optix 30" WFHD/200 Hz 289€ • WD_BLACK SN850 2 TB 189€ • NBB Black Weeks [Werbung]
    •  /