Abo
  • Services:

Mongoose: Samsung erklärt M1-Kerne des Galaxy S7 und Note 7

Das beste Quadcore-Design für Smartphones: Samsung hat erklärt, wieso die M1-Prozessorkerne des Exynos-Chips im Galaxy S7 so gut seien - und gibt zu, dass aufgrund der schnellen Entwicklung der Nachfolger deutlich verbessert werde.

Artikel veröffentlicht am ,
Floorplan eines M1-Kerns
Floorplan eines M1-Kerns (Bild: Samsung)

Samsung hat sich auf der Hot Chips 28 ausführlich zu den M1-Prozessorkernen des Exynos 8890 geäußert. Dieses System-on-a-Chip steckt in der europäischen Version des Galaxy S7 und im neuen Note 7; verantwortlich für die unter dem Codenamen Mongoose (Maguste) entwickelten Kerne war Brad Burgess. Dieser zeichnet unter anderem auch für die sogenannten Cat-Cores von AMD verantwortlich, angefangen bei Bobcat über Jaguar bis Puma.

Stellenmarkt
  1. Fresenius Netcare GmbH, Bad Homburg
  2. über duerenhoff GmbH, Raum Nürnberg

Das Ziel war es, auf Basis der ARMv8-Architektur innerhalb eines Zeitfensters von drei Jahren ein eigenes Design zu entwickeln. Die erste Ausbaustufe namens M1 besteht aus vier Kernen, die als Cluster rund um eine L2-Kontrolleinheit angeordnet sind, die vier Cache-Partitionen mit insgesamt zwei MByte verwaltet. Im Exynos 8890 ist ein Cluster aus vier Mongoose-1- mit einem Cluster aus vier A57-Kernen per proprietärem Interconnect gekoppelt.

  • Sprungvorhersage eines M1-Kerns (Bild: Samsung)
  • Instruktionen-Caches eines M1-Kerns (Bild: Samsung)
  • Decode-Stufe eines M1-Kerns (Bild: Samsung)
  • Integer-Einheiten eines M1-Kerns (Bild: Samsung)
  • Gleitkomma-Einheiten eines M1-Kerns (Bild: Samsung)
  • Load-/Store-Einheiten eines M1-Kerns (Bild: Samsung)
  • L2-Block eines M1-Kerns (Bild: Samsung)
  • Floorplan eines M1-Kerns (Bild: Samsung)
  • Floorplan eines M1-Clusters (Bild: Samsung)
  • M1 verglichen mit A57, Singlethread, nicht taktnormiert (Bild: Samsung)
  • M1 verglichen mit A57, Multithread, nicht taktnormiert (Bild: Samsung)
  • M1 verglichen mit A57, Effizienz, nicht taktnormiert (Bild: Samsung)
Sprungvorhersage eines M1-Kerns (Bild: Samsung)

Wie ein Blick auf die einzelnen Bestandteile eines M1-Kerns zeigt, steht ein solcher einem heutigen Desktop-Design kaum nach, was allerdings für diverse aktuelle ARM-Implementierungen gilt: Die internen Buffer und die (Loop-)Cache-Stufen fallen groß aus (64 KByte L1I + 32 KByte L1D), und die internen Physical Register sowie die Scheduler fassen viele Einträge.

Generell gibt Samsung an, dass das Speichersubsystem mit geringen Latenzen arbeite und einzig die (unter) drei Watt pro Kern das Design einschränkten. Da Samsung schon vor zwei Jahren ein ARM-Design für Server eingestellt haben soll, könnte der M1 eine Art Mobile-Ableger davon sein. Bestätigt ist das aber nicht, und Samsung schwieg darüber vor Ort.

  • Sprungvorhersage eines M1-Kerns (Bild: Samsung)
  • Instruktionen-Caches eines M1-Kerns (Bild: Samsung)
  • Decode-Stufe eines M1-Kerns (Bild: Samsung)
  • Integer-Einheiten eines M1-Kerns (Bild: Samsung)
  • Gleitkomma-Einheiten eines M1-Kerns (Bild: Samsung)
  • Load-/Store-Einheiten eines M1-Kerns (Bild: Samsung)
  • L2-Block eines M1-Kerns (Bild: Samsung)
  • Floorplan eines M1-Kerns (Bild: Samsung)
  • Floorplan eines M1-Clusters (Bild: Samsung)
  • M1 verglichen mit A57, Singlethread, nicht taktnormiert (Bild: Samsung)
  • M1 verglichen mit A57, Multithread, nicht taktnormiert (Bild: Samsung)
  • M1 verglichen mit A57, Effizienz, nicht taktnormiert (Bild: Samsung)
M1 verglichen mit A57, Singlethread, nicht taktnormiert (Bild: Samsung)

Via Frontend werden vier Instruktionen pro Takt decodiert und sieben Befehle pro Takt an zwei Gleitkomma- und sieben Integer-Ausführungseinheiten geschickt. Bei Last auf einem Kern läuft dieser mit 2,6 GHz, bei Last auf dem Quadcore-Cluster sind es noch 2,3 GHz. Auffällig ist, dass die M1- verglichen mit den A57-Kernen (2,1 GHz) taktnormiert kaum flotter rechnen, die effektive Speicherbandbreite allerdings weitaus höher liegt.

Lohn der Mühen ist neben der höheren Geschwindigkeit eine bessere Energieeffizienz. Daran hat auch der Prozessor seinen Anteil, da Samsung den Exynos im 14LPP-Verfahren produziert und den Vorgänger im etwas älteren 14LPE-Node. Für den Nachfolger des M1 will Samsung einige Punkte verbessern, der Exynos 8893 dürfte im Frühling 2017 in ersten Geräten zu sehen sein.



Anzeige
Spiele-Angebote
  1. (-68%) 8,99€
  2. 8,49€
  3. 14,99€
  4. 1,29€

t3st3rst3st 24. Aug 2016

Multicore verliert das Apple SOC. Wen wunderts. So sieht es aktuell halt aus wenn ein...

curious_sam 24. Aug 2016

Weil Mongoose Schlangen essen, darunter sicher auch mal ne Krait! Der Witz ist etwas...

Graveangel 24. Aug 2016

Die Unterstützung von diesen Geräten ist leider nur sehr schlecht. Woran es genau liegt...


Folgen Sie uns
       


The Cleaners - Interview mit den Regisseuren

Die beiden deutschen Regisseure Moritz Riesewieck und Hans Block schildern im Interview mit Golem.de Hintergründe über ihren Dokumentationsfilm The Cleaners.

The Cleaners - Interview mit den Regisseuren Video aufrufen
Highend-PC-Streaming: Man kann sogar die Grafikkarte deaktivieren
Highend-PC-Streaming
Man kann sogar die Grafikkarte deaktivieren

Geforce GTX 1080, 12 GByte RAM und ein Xeon-Prozessor: Ab 30 Euro im Monat bietet ein Startup einen vollwertigen Windows-10-Rechner im Stream. Der Zugriff auf Daten, Anwendungen und Games soll auch unterwegs mit dem Smartphone funktionieren.
Von Peter Steinlechner

  1. Golem.de-Livestream Halbgott oder Despot?
  2. Rundfunk Medienanstalten wollen Bild Livestreaming-Formate untersagen
  3. Illegale Kopien Deutsche Nutzer pfeifen weiter auf das Urheberrecht

Ryzen 5 2600X im Test: AMDs Desktop-Allrounder
Ryzen 5 2600X im Test
AMDs Desktop-Allrounder

Der Ryzen 5 2600X ist eine der besten sechskernigen CPUs am Markt. Für gut 200 Euro liefert er die gleiche Leistung wie der Core i5-8600K. Der AMD-Chip hat klare Vorteile bei Anwendungen, das Intel-Modell in Spielen.
Ein Test von Marc Sauter

  1. Golem.de-Livestream Wie gut ist AMDs Ryzen 2000?
  2. RAM-Overclocking getestet Auch Ryzen 2000 profitiert von schnellem Speicher
  3. Ryzen 2400GE/2200GE AMD veröffentlicht sparsame 35-Watt-APUs

Noctua NF-A12x25 im Test: Spaltlos lautlos
Noctua NF-A12x25 im Test
Spaltlos lautlos

Der NF-A12x25 ist ein 120-mm-Lüfter von Noctua, der zwischen Impeller und Rahmen gerade mal einen halben Millimeter Abstand hat. Er ist überraschend leise - und das, obwohl er gut kühlt.
Ein Test von Marc Sauter

  1. NF-A12x25 Noctua veröffentlicht fast spaltlosen 120-mm-Lüfter
  2. Lüfter Noctua kann auch in Schwarz
  3. NH-L9a-AM4 und NH-L12S Noctua bringt Mini-ITX-Kühler für Ryzen

    •  /