Abo
  • Services:
Anzeige
Die Zen-Architektur soll bei der Leistung pro Takt einen gewaltigen Sprung nach vorne bedeuten.
Die Zen-Architektur soll bei der Leistung pro Takt einen gewaltigen Sprung nach vorne bedeuten. (Bild: AMD)

CPU-Architektur: AMDs Zen ähnelt Intels Haswell

Die Zen-Architektur soll bei der Leistung pro Takt einen gewaltigen Sprung nach vorne bedeuten.
Die Zen-Architektur soll bei der Leistung pro Takt einen gewaltigen Sprung nach vorne bedeuten. (Bild: AMD)

Ein Compiler-Patch für die GCC verrät erste Details zu AMDs CPU-Architektur Zen: Die erinnert mit vier Integer- und zwei FMA-Gleitkomma-Einheiten pro Kern stark an Intels Haswell-Technik und könnte Ideen der neuen Skylake-Architektur aufgreifen.

Anzeige

AMD hat vor einigen Tagen einen Compiler-Patch für die GNU Compiler Collection (GCC) eingereicht, den Matthias Waldhauer alias Dresdenboy entdeckt hat. Der Patch nennt diverse Einzelheiten zur Kern-Technik von AMDs Zen-Architektur für kommende CPUs und Chips mit integrierter Grafikeinheit. Die veröffentlichten Details zeigen eine Architektur, die viele Gemeinsamkeiten mit Intels Haswell-Technik aufweist und modular aufgebaut sein könnte, um unterschiedliche Marktsegmente zu bedienen.

Kern mit SMT statt Modul

Größter Unterschied zu den bisherigen Ausbaustufen der Bulldozer-Architektur: Zen basiert auf einem klassischen Kern mit Simultaneous Multithreading (Intel nennt das Hyperthreading) und nicht mehr auf einem Modul; es gibt also keine zwei Integer-Blöcke mehr, sondern einen. Beim Frontend hat AMD die Dekoder-Stufe vierfach ausgelegt, was Intels Haswell-Frontend entspricht. Bulldozer-Versionen bis Piledriver mussten mit einem vierfachen Dekoder für beide Integer-Blöcke und die Gleitkomma-Einheit auskommen, wodurch die Ausführungseinheiten teils warten. Seit Steamroller - also der letzten Generation, denn aktuell ist Excavator - nutzt AMD zwei vierfach ausgelegte Dekoder um die Integer- und Floating-Point-Pipelines schneller zu befüllen.

Zen hat so viele Rechenwerke wie Haswell

Interessant wird es bei der Anzahl der Zen-Rechenwerke: In jedem Kern stecken vier Integer-ALUs, zwei als Lade-/Speicher-Einheiten ausgelegte AGUs und eine in vier Pipelines aufgeteilte Gleitkomma-Einheit. Damit verfügt ein Zen-Kern über die gleiche Anzahl an Ausführungseinheiten wie Intels Haswell. Die Leistung kann sich aber unterscheiden, da bei Haswell eine abgespeckte AGU als dritte Speicher-Einheit dient, die bei Zen offenbar fehlt. Unklar bleibt zudem, wie der Scheduler und dessen Ports arbeiten, etwa ob sich Ausführungsschritte in bestimmten Fällen blockieren und wie zügig das Frontend Daten anliefert.

Die Gleitkomma-Einheit besteht aus vier 128-Bit-Pipelines, je zwei kümmern sich um Additionen und Multiplikationen. Durch Zusammenschalten entstehen zwei 256-Bit-Einheiten wie bei Intel, was für FMA wichtig ist. Ein Zen-Kern ist bei ADD/MUL mächtiger als ein bei FP-Berechnungen schwaches Bulldozer-Modul und bietet die gleiche FMA- sowie Integer-Leistung. Sofern ein kommender Chip über acht Kerne verfügt, sollte eine solche CPU einen aktuellen FX mit vier Modulen rein von den Ausführungseinheiten her deutlich schlagen.

Im Vergleich mit Intels Haswell fällt die Gleitkomma-Einheit von Zen zwiespältig aus: Zwar sind vier Float-Pipelines vorhanden, womit zwei Additionen und zwei Multiplikationen durchführbar sind statt wie bei Intel nur zwei. Bei AVX(2)-Code aber haben die 256- statt 128-Bit-Einheiten von Intel Taktvorteile, was jedoch für gewöhnlichen Code keine Auswirkungen hat. Intel behielt die 256-Bit-FPs bei den aktuellen Skylake-Modellen bei, erst die Server-Versionen (Skylake-EP/-EX) werden auf 512 Bit aufgebohrt. AMD geht eventuell ähnlich vor oder vollzieht diesen Schritt mit einer kommenden Zen-Version.

Kleinere, aber schnelle Caches - wie bei Intel

Als eines der Probleme der Bulldozer-Technik galten der kleine L1-Daten-Cache und der große, aber nicht sehr schnelle L2-Puffer. Bei Zen orientiert sich AMD an den Kapazitäten aktueller Intel-Chips und vermutlich am vollständig inklusiven Cache-Design: Bei den frühen Versionen der Bulldozer-Architektur fasste der L1D nur 16 KByte, erst Excavator (Carrizo) sichert 32 KByte. Das gilt auch für Zen, für frühere AMD-Kerne und für alle Intel-Architekturen seit Core. Vorerst unbekannt bleibt der L1-Cache, er dürfte mindestens 32 KByte fassen.

Der L2-Cache eines Zen-Kerns fasst 512 KByte, bei den Bulldozer-Derivaten sind es 2.048 KByte pro Modul und bei Intel aktuell 256 KByte. Generell betonte AMD bisher, die Register- und Cache-Geschwindigkeiten bei Zen drastisch beschleunigen und die Latenzen stark verringern zu wollen, was zu den im Compiler-Patch aufgeführten Kapazitäten des Speichersubsystems passt. Die Kapazität des L3-Cache - oder ob er überhaupt vorhanden ist -, hat mit der Kern-Architektur nichts zu tun und wird im Compiler-Patch nicht erwähnt.

Viele wichtige Fragen noch offen

Jegliche Angaben zur Anzahl der Ausführungseinheiten sind nutzlos, wenn die Caches zu lahm sind oder der generelle Takt des Prozessors niedrig - warum auch immer. Bei den aktuellen FX erreicht AMD hohe Frequenzen einzig auf Kosten der Leistungsaufnahme, da der 32-nm-Prozess verglichen mit Intel 14FF-Verfahren alles andere als modern ist. Zen-basierte Chips dürften jedoch in der 14FF-Variante von Globalfoundries hergestellt werden.

Die LPP-Fertigung sollte unserer Einschätzung nach Taktraten zwischen 3 und 4 GHz bei unter 100 Watt ermöglichen, also auf dem Niveau von Intels Prozessoren. Sollte AMD FX-Chips mit acht Kernen veröffentlichen, könnten die Skylake- und Kaby-Lake-Modelle mit vier Kernen für den Sockel 1151 eventuell einen starken Gegner erhalten. Es wäre AMD zu wünschen.


eye home zur Startseite
Dresdenboy 17. Okt 2015

Meinst du die reinen CPU-Kerne? Das wird nur mit Hilfe von AVX/AVX2/AVX512 noch etwas so...

gruffi 11. Okt 2015

Das stimmt so definitiv nicht. Man muss hier differenzieren. Ich kenne es von grösseren...

gruffi 11. Okt 2015

Du liegst eigentlich in praktisch allen Punkten daneben oder zumindest sind diese recht...

plutoniumsulfat 05. Okt 2015

Stimmt, da ist was dran, habe ich nicht dran gedacht ;)

matok 05. Okt 2015

Naja, mehr oder weniger. Intels Griff um die OEMs ist ziemlich eisern. Der x86 CPU Markt...



Anzeige

Stellenmarkt
  1. M-net Telekommunikations GmbH, München
  2. Daimler AG, Sindelfingen
  3. censhare AG, München
  4. Dentsply Sirona, The Dental Solutions Company, Bens­heim


Anzeige
Blu-ray-Angebote
  1. 29,99€ (Vorbesteller-Preisgarantie)
  2. (u. a. The Revenant 7,97€, James Bond Spectre 7,97€, Der Marsianer 7,97€)
  3. Einzelne Folge für 2,99€ oder ganze Staffel für 19,99€ kaufen (Amazon Video)

Folgen Sie uns
       


  1. Bundesverkehrsministerium

    Dobrindt finanziert weitere Projekte zum autonomen Fahren

  2. Mobile

    Razer soll Smartphone für Gamer planen

  3. Snail Games

    Dark and Light stürmt Steam

  4. IETF

    Netzwerker wollen Quic-Pakete tracken

  5. Surface Diagnostic Toolkit

    Surface-Tool kommt in den Windows Store

  6. Bürgermeister

    Telekom und Unitymedia verweigern Open-Access-FTTH

  7. Layton's Mystery Journey im Test

    Katrielle, fast ganz der Papa

  8. Kabel und DSL

    Vodafone gewinnt 100.000 neue Festnetzkunden

  9. New Technologies Group

    Intel macht Wearables-Sparte dicht

  10. Elektromobilität

    Staatliche Finanzhilfen elektrisieren Norwegen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Neuer A8 vorgestellt: Audis Staupilot steckt noch im Zulassungsstau
Neuer A8 vorgestellt
Audis Staupilot steckt noch im Zulassungsstau
  1. Autonomes Fahren Continental will beim Kartendienst Here einsteigen
  2. Verbrenner Porsche denkt über Dieselausstieg nach
  3. Autonomes Fahren Audi lässt Kunden selbstfahrenden A7 testen

Anker Powercore+ 26800 PD im Test: Die Powerbank für (fast) alles
Anker Powercore+ 26800 PD im Test
Die Powerbank für (fast) alles
  1. SW271 Benq bringt HDR-Display mit 10-Bit-Panel
  2. Toshiba Teures Thunderbolt-3-Dock mit VGA-Anschluss
  3. Anker Powercore+ 26800 PD Akkupack liefert Strom per Power Delivery über USB Typ C

Matebook X im Test: Huaweis erstes Ultrabook glänzt
Matebook X im Test
Huaweis erstes Ultrabook glänzt
  1. Huawei Neue Rack- und Bladeserver für Azure Stack vorgestellt
  2. Matebook X Huaweis erstes Notebook im Handel erhältlich
  3. Y6 (2017) und Y7 Huawei bringt zwei neue Einsteiger-Smartphones ab 180 Euro

  1. Re: Solange die Elektroautos Teurer sind als...

    Berner Rösti | 08:25

  2. Re: Mindesthaltbarkeitsdatum auf Smartphone

    robinx999 | 08:21

  3. Re: Steuergeldverschwendung

    cyro | 08:16

  4. Re: Ein bisschen ironisch ist das schon

    GangnamStyle | 07:01

  5. Artikelfehler: Synchro und iOS Spielstände

    MaxZeigert | 06:54


  1. 16:55

  2. 16:33

  3. 16:10

  4. 15:56

  5. 15:21

  6. 14:10

  7. 14:00

  8. 12:38


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel