FX-8350 mit 4 GHz im Test: AMDs neuer FX mit kleinem Preis und hohem Takt

Bulldozer, die Zweite: Diesmal will AMD von Anfang an alles richtig machen. Während die ersten Prozessoren der Serie FX mit Bulldozer-Architektur in Desktop-PCs enttäuschten, sollen die neuen CPUs mit Codenamen Vishera gleich so günstig angeboten werden, wie es ihrer Rechenleistung entspricht.
Bei den ersten Bulldozern , Codename Zambezi, die vor einem Jahr erschienen, setzte AMD zunächst einen OEM-Preis von 245 US-Dollar für das Spitzenmodell FX-8150 fest und musste dann binnen Wochen zwei Preissenkungen vornehmen . Der neue Topprozessor für Desktop-PCs, FX-8350, kostet nun gleich von Anfang an nur 195 US-Dollar.











Dafür gibt es acht Integer-Kerne, die sich auch wie ein Octo-Core gegenüber einem Betriebssystem darstellen, aber bedingt durch das Modulkonzept von Bulldozer weiterhin nur vier FPU-Einheiten. Zahlreiche kleine Verbesserungen im Frontend der Architektur sollen jedoch laut AMD für einen Temposchub bei gleichem Takt von 10 bis 15 Prozent sorgen.
Dazu kommt noch ein gesteigerter Basistakt: Der 8350 arbeitet mit 4,0 GHz und bis zu 4,2 GHz per Turbo. In Single-Thread-Anwendungen, wo der Turbo voll greifen kann, ist er damit nicht höher getaktet als der 8150, der mit 3,6 GHz bis 4,2 GHz arbeitet.
Nicht verändert haben sich auch die anderen Eckdaten. Die neuen FX-CPUs - Codename Vishera - basieren auf dem Orochi-Die der Achtkern-Opterons und sind weiterhin mit 32 Nanometer breiten Strukturen gefertigt. Daher hat sich auch die Angabe von 1,2 Milliarden Transistoren auf 315 Quadratmillimetern Die-Fläche nicht geändert.
Eng verwandt sind die Visheras auch mit den neuen Desktop-Trinitys , denn die CPU-Kerne mit Codenamen Piledriver sind dieselben. Über eine integrierte Grafikeinheit verfügen die neuen FX-Prozessoren weiterhin nicht, dafür passen sie aber auch in den existierenden Sockel AM3+. AMD empfiehlt jedoch dringend, bestehende Mainboards nur dann weiter zu verwenden, wenn ein Bios-Update für Vishera existiert.
Piledriver sucht Daten schneller
Wie schon bei den Trinity-APUs für Desktops kommen bei Vishera neue CPU-Kerne namens Piledriver zum Einsatz. Sie sind eine leicht erweiterte Version der Bulldozer-Architektur , die mit Modulen statt streng getrennten Cores arbeitet. Weiterhin teilen sich also zwei Integer-Einheiten einen Funktionsblock aus FPU und SSE-Einheiten.
Die größte Herausforderung bei diesem " shared frontend " ist es, die Arbeit schnell und gleichmäßig auf die Funktionseinheiten zu verteilen, wie AMDs Chefarchitekt Mike Goddard im Gespräch mit Golem.de betonte. Daher haben die Entwickler bei Vishera auch am Frontend und dem L1-Cache angesetzt, genauer: dem TLB.











Dieser "translation lookaside buffer" , der AMD schon einmal große Probleme bereitet hatte , wurde bei Vishera für die L1-Caches vergrößert - um wie viele Einträge, verriet Mike Goddard auch auf Nachfragen nicht. Der TLB setzt die virtuellen Adressen im Inneren der CPU in die physikalischen im Hauptspeicher um, indem er in einer sehr schnellen Pufferschaltung Tabellen dafür führt.
Goddard zufolge stellte sich der TLB für die L1-Caches als eines der wichtigsten Elemente der Bulldozer-Architektur heraus, weil sich damit zeitraubende Speicherzugriffe besonders gut abfangen lassen. Wenn Daten nicht im L1-Cache vorhanden sind und aus dem L2-Cache geholt werden müssen, vergehen dem Entwickler zufolge bei Bulldozer dabei bis zu 20 Takte.
Die Aufgabe, so Goddard, ist es also, "die zu erledigende Arbeit schnell zu finden" . Nicht nur der L1-TLB wurde dazu überarbeitet, sondern auch die Load/Store-Einheiten und die Prefetcher. Sie besitzen nun nahezu direkte Anbindungen an den Hauptspeicher, so dass sie den TLB entlasten können, um die als Nächstes benötigten Daten zu finden.
Mike Goddard zufolge ergaben sich diese Änderungen aus Erfahrungen mit Supercomputern. Die dort eingesetzten Programme arbeiten mit sehr großen Datenstrukturen, die in Dutzenden von Gigabyte RAM pro Kern stark verteilt liegen können. Die Wahrscheinlichkeit, dass die gerade wichtigen Informationen in den Caches liegen, sinkt dadurch. Also war es AMDs Ziel, über das Frontend der Piledriver-Kerne die Zugriffe auf den Hauptspeicher so weit wie möglich zu reduzieren, indem schon vor dem Laden in die Caches abgeschätzt wird, ob die richtigen Daten übertragen werden.
Anwender von typischen Desktopanwendungen profitieren davon ebenfalls. Laut Mike Goddard ist die bessere Verwaltung des L1-Caches dafür verantwortlich, dass Piledriver gegenüber Bulldozer bei Single-Thread-Anwendungen pro Takt 10 bis 15 Prozent schneller arbeiten kann, was unsere Benchmarks von AMDs FX-8350(öffnet im neuen Fenster) in Zusammenarbeit mit PC Games Hardware auch bestätigen. Diese Befehle pro Takt (IPC) sind eine Schwäche der AMD-Designs, Intel liegt hier seit Jahren vorne. Mit Piledriver soll der Abstand nun verkürzt werden.
Synthetische Benchmarks und Videocodierung
Cinebench R11.5 in der 64-Bit-Version bietet eine gute Unterscheidung zwischen der Single- und Multi-Thread-Performance einer CPU. Das Programm - das auf der realen Anwendung Cinema4D basiert - lässt sich sowohl auf einem Kern ausführen als auch auf allen verfügbaren. Wichtig ist beim Single-Thread-Test dabei der Turbo, den die CPUs voll ausreizen können, bei den Zambezis und Visheras kann er maximal bis auf 4,2 GHz hochschalten.











Dabei kommt der 8150 auf 1,02 Punkte, der 8350 schon auf 1,10 Punkte. Die Verbesserungen der Piledriver-Kerne wirken sich also deutlich aus. Zwar erreicht ein Core i7-2700K hier schon im Single-Thread-Test 1,56 Punkte, der Abstand relativiert sich aber durch die doppelte Zahl der physikalischen Kerne.
So sind im Multi-Thread-Test für den 8350 6,86 Punkte zu verzeichnen, der 2700K liegt mit 7,05 Punkten deutlich weniger weit vorne als bei Ausführung auf einem Kern. Das bedeutet: Auch wenn AMDs Architektur bei Single-Thread-Anwendungen weiterhin langsamer als Intels Design ist, relativiert sich das, wenn Anwendungen gut in Threads aufgeteilt sind. Sowohl bei Single- als auch Multi-Threads ist der FX-8350 schneller als ein Core i5-3570K, der fast gleich viel kostet und von AMD auch als Gegner genannt wird.
Noch klarer sichtbar wird der Vorteil vieler Integer-Kerne vermeintlich beim Videocodieren mit x.264, hier spielt die bei Intel schnellere FPU aber weniger eine Rolle, vielmehr sind die SSE-Einheiten stärker gefordert. Mit 37,3 fps ist der Core i7-2700K gegenüber den 42,8 fps des FX-8350 im Hintertreffen.
Spiele und Leistungsaufnahme
Die Leistung von FPU und SSE-Einheiten, zusammen mit der Single-Thread-Leistung, ist nach wie vor bei den meisten Spielen entscheidend. Diese Programme sind bei weitem nicht so einfach in Threads aufzuteilen wie Medienanwendungen, und daher liegt AMD auch immer noch zurück.
Selbst beim gut gethreadeten Dirt 3 kommt der FX-8350 im Mittel nur auf 77 fps, ein Core i7-2700K auf 86 fps. Das reicht jedoch stets für flüssiges Spielen in Full-HD, so dass der Unterschied in der Praxis kaum eine Rolle spielt. Zahlreiche weitere Tests des AMD FX-8350(öffnet im neuen Fenster) mit Spielen finden sich bei PC Games Hardware.











Deutlicher sind da schon die Unterschiede bei der Leistungsaufnahme, gemessen wird jeweils das Gesamtsystem mit der sparsamen Grafikkarte GT430 von Nvidia, die in Ruhe und bei 2D-Anwendungen nur rund 7 Watt aufnimmt. Auf dem Windows-Desktop ist der 8350 noch recht genügsam, der Rechner benötigt dabei nur 43 Watt - mit sparsameren Netzteilen ist das auch noch zu drücken.
Unter Volllast beim Videocodieren mit x.264 kommt das Vishera-System jedoch auf 199 Watt, was Zweifel an der TDP-Angabe von 125 Watt aufwirft. Immerhin nimmt der zweite Bulldozer trotz höheren Basistakts aber nur wenig mehr Leistung auf als der erste, der 8150 kommt beim gleichen Test auf 194 Watt.
Selbst der bei diesem Test fast gleich schnelle - aber viel teurere - Core i7-3770K, Intels Spitzenmodell der Ivy-Bridge-Serie, ist hier mit 105 Watt sehr viel sparsamer. Nicht nur die Effizienz der Intel-Architektur, sondern auch der Vorsprung der Strukturbreite zeigt sich hier. Während AMD noch mit 32 Nanometern aus Globalfoundries-Fertigung auskommen muss, kann Intel selbst seine CPUs schon mit 22-Nanometer-Technik herstellen.
Fazit
"AMD hat keine CPUs für Enthusiasten mehr" - so oder ähnlich ist es in vielen Foren seit dem mit großen Hoffnungen gestarteten Bulldozer zu lesen. Das war jedoch auch schon mit den ersten FX-CPUs nur die halbe Wahrheit. Betrachtet man nur die Benchmarks, so hat auch Vishera zwar gegen teurere Sandy- und Ivy-Bridge-CPUs von Intel kaum eine Chance, einen Core i7 kann der Prozessor kaum schlagen, einen Core i5 jedoch häufig. In der Single-Thread-Leistung hat AMD je nach Test zwischen 10 und 20 Prozent zugelegt, was an den Piledriver-Kernen und nicht am unveränderten Turbotakt liegt. Das Starten von Anwendungen, auch bei hoher Last, klappt durch acht physikalische Integer-Kerne schnell.











So viel Leistung für 200 Euro sowie freie Multiplikatoren machen die CPUs nicht nur sinnvoll für den praktischen Einsatz, sondern auch zu einem günstigen Technikspielzeug. Übertakten ist damit kein großes Problem, was aber nur Rekordjäger auf der Suche nach der höchsten machbaren Frequenz interessiert.
Weit abgeschlagen ist AMD jedoch bei der Leistungsaufnahme unter Last: 199 Watt benötigt das Gesamtsystem mit FX-8350 beim HD-Videocodieren mit x264, ähnlich schnelle Intel-CPUs liegen 80 bis 90 Watt darunter. Bei ruhendem System sind die Plattformen aber fast gleichauf.
Damit empfiehlt sich der neue FX vor allem für Anwender, die für einen geringen Preis einen PC bauen wollen, der nur selten unter Höchstlast arbeitet. Beim Spielen ist ohnehin eine schnelle Grafikkarte der größte Verbraucher, so dass die Wahl nur dafür nicht nur nach Rechenleistung und Leistungsaufnahme getroffen werden dürfte.
Die Unterschiede in der Leistung sind jedoch zu gering, um ein System mit einem FX-8150 gleich aufzurüsten. Soll eine kleinere CPU ersetzt oder ein neuer Rechner zusammengestellt werden, empfiehlt sich gleich das neue Topmodell FX-8350. Komplett-PCs unter 800 Euro, die fit für alle Anwendungsbereiche sind, lassen sich so auch mit einer schnellen Grafikkarte zusammenstellen. Wieder einmal muss AMD aber dafür die PC-Hersteller überzeugen, am besten mit schneller und anhaltender Verfügbarkeit der neuen CPUs.



