CPU-Architektur: Darum ist Apples A7 so schnell

Anandtech hat anhand von Apples Kommentaren in einem Compiler und eigenen Programmen Apples A7-SoC im iPhone 5S und im iPad Air analysiert. Das Ergebnis: Apples ARM-Kerne orientieren sich viel stärker an großen PC-Prozessoren, als man bisher annehmen konnte.

Artikel veröffentlicht am ,
Der A7 auf dem Mainboard des iPhone 5S
Der A7 auf dem Mainboard des iPhone 5S (Bild: Ifixit.com)

Mit dem ARM-SoC A7, das erstmals im iPhone 5S zum Einsatz kam, hat Apple die Rechenleistung seiner selbst entwickelten Chips in etwa verdoppelt - ein Kunststück, das heute von einer Architektur zur nächsten nicht mehr selbstverständlich ist. Anders als andere Prozessorentwickler wie AMD, IBM und Intel dokumentiert Apple seine Designs aber nicht öffentlich, mit der Zeit kommen einige Details aber doch ans Licht. Das ist unter anderem durch Kommentare im Quelltext des LLVM-Compilers der Fall, den Apple einsetzt. Damit Programmierer die Vorzüge einer neuen Architektur kennen, müssen sie ihren Code entsprechend auslegen, sonst bleiben die Techniken, die mehr Tempo möglich machen, ungenutzt.

Inhalt:
  1. CPU-Architektur: Darum ist Apples A7 so schnell
  2. A7 orientiert sich an x86-CPUs

So kommt auch Anand Lal Shimpi zu dem Schluss: "Bisher gibt es fast keine Anwendung unter iOS, welche die Rechenleistung des Prozessors ausnutzt." Dazu hat Shimpi sowohl die Kommentare im Compiler untersucht als auch auf Tipps von anderen Programmierern gehört und seine Theorien mit einigen Beispielprogrammen untersucht.

Die Architektur des A7 trägt den Codenamen "Cyclone", der Vorgänger heißt "Swift". Dabei fand auch ein Wechsel des ARM-Designs v7 auf v8 statt, ARM-v8 ist die erste 64-Bit-Architektur für die kleinen Kerne - obwohl klein hier nicht mehr ganz passt: Der A7 besteht aus über einer Milliarde Transistoren und ist 102 Quadratmillimeter groß.

Diese große Die-Fläche hat Apple zunächst für das Offensichtliche genutzt, denn die L1-Caches für Daten und Befehle wurden von je 32 auf 64 KByte verdoppelt. Der L2-Cache blieb mit 1 MByte unverändert, zusätzlich gibt es aber noch einen L3-Cache von 4 MByte. Damit spart Apple viele Zugriffe auf den Hauptspeicher ein, da dieser bei den ARM-Designs wie auch bei PCs in der vergangenen Zeit kaum schneller wird.

Vor allem aber hat Apple die Parallelität in den CPU-Kernen stark erhöht. Wie auch moderne PC-CPUs sind die ARM-Cores superskalar, sie können mehr als einen Befehl in einem Takt abarbeiten. Außerdem arbeiten sie mit Micro-Ops, welche im Out-of-Order-Verfahren umsortiert werden können. Die Grundlagen solcher Architekturen hat Golem.de am Beispiel von Intels erster Core-Architektur ausführlich erklärt.

Gegenüber dem A6 kann der A7 ganze sechs statt drei Befehle gleichzeitig verarbeiten. Der Puffer, in dem die Micro-Ops in eine optimale Reihenfolge gebracht werden können, fasst nun 192 statt 45 Einträge. Zum Vergleich: Selbst bei Intels aktueller Architektur Haswell ist dieser Reorder-Buffer nicht größer.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
A7 orientiert sich an x86-CPUs 
  1. 1
  2. 2
  3.  


Anonymer Nutzer 16. Mai 2014

Unwort des Jahres "FLAGSCHIFF". Ich kann es nicht mehr lesen :D

Tom01 14. Apr 2014

Ein ATOM ist nicht mal ansatzweise so schnell wie ein Power4 oder G5 Prozessor.

Tom01 14. Apr 2014

Mit Desktop-Class ist ja auch der neue 64-Bit A7 Chip gemeint nicht die alten Raspberry...

Sander Cohen 03. Apr 2014

Ach, kommt schon hin! Freiwillig würde ich mit Gimp auch nicht arbeiten wollen! Da gibt...



Aktuell auf der Startseite von Golem.de
Apple
Vision Pro zwischen Finger-Tracking-Lob und Gewicht-Kritik

Sehr gutes Bild, nahezu perfekte Bedienung aber ein bisschen zu schwer: Die ersten Hands-ons von Apple Vision Pro sind insgesamt positiv.
Ein Bericht von Peter Steinlechner

Apple: Vision Pro zwischen Finger-Tracking-Lob und Gewicht-Kritik
Artikel
  1. Zen 4c Bergamo: So schrumpft AMD die Epyc-Kerne um fast die Hälfte
    Zen 4c Bergamo
    So schrumpft AMD die Epyc-Kerne um fast die Hälfte

    Bis zu 128 Kerne stellt AMD gegen ARM-Server-Prozessoren und Intels E-Cores. Kompromisse und neue Technik machen die kleineren Kerne möglich.

  2. Diablo 4 im Test: Blizzards Meisterwerk definiert das Genre neu
    Diablo 4 im Test
    Blizzards Meisterwerk definiert das Genre neu

    Unsere Hoffnungen bewahrheiten sich: Diablo 4 ist der beste Teil der exzellenten Spieleserie, an der sich auch Konkurrenten messen müssen.
    Ein Test von Oliver Nickel

  3. SAN: Zweites Leben für ausrangierte Firmenhardware
    SAN
    Zweites Leben für ausrangierte Firmenhardware

    Wenn die lokale Festplatte randvoll ist, können Speicherlösungen aus professioneller Umgebung die Antwort sein. Wir zeigen, wie.
    Eine Anleitung von Nico Ruch

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • PS5-Spiele & Zubehör bis -75% • Samsung 990 Pro 1TB (PS5) 94€ • AirPods 2 125€ • Crucial SSD 1TB 41,99€ • Thrustmaster T300 RS 299,99€ • Bis 50 % auf Gaming-Produkte bei NBB • PS5 inkl. Spiel 549€ • MSI RTX 4070 Ti 999€ • MindStar: AMD Ryzen 7 5800X3D 285€, RX 7900 XTX 989€ [Werbung]
    •  /