Zum Hauptinhalt Zur Navigation

Dual Graphics und Frame Pacing im Test: Symbiose aus Kern und Karte

Was lange währt, wird endlich besser: Beim dritten Anlauf erreicht AMDs Dual Graphics für Kaveri eine deutlich höhere Spieleleistung durch die Kombination aus integrierter Grafikeinheit und dedizierter Karte. Frame Pacing ermöglicht eine gleichmäßige Bildrate.
/ Marc Sauter
19 Kommentare News folgen (öffnet im neuen Fenster)
Dual Graphics mit Kaveri und Frame Pacing im Test (Bild: Fabian Hamacher/Golem.de)
Dual Graphics mit Kaveri und Frame Pacing im Test Bild: Fabian Hamacher/Golem.de

Mit Kaveri versucht AMD im dritten Anlauf die Dual-Graphics-Probleme der Vorgängergenerationen Llano und Trinity respektive Richland in den Griff zu bekommen - mit Erfolg, so viel sei vorab gesagt.

In der Theorie klang Dual Graphics schon immer gut: Einfach eine Accelerated Processing Unit (APU) kaufen, also einen Chip mit integrierter Grafikeinheit, und eine dedizierte Grafikkarte hinzustecken, um die Spieleleistung günstig fast zu verdoppeln. Was auf dem Papier nach einer tollen Technik klingt, funktioniert seit zwei Generationen von APUs nicht zufriedenstellend, denn trotz deutlich mehr Bildern pro Sekunde leidet das Spielgefühl unter einem sehr unregelmäßigen, stotternden Bildaufbau.

Noch 2011 sprach AMD von Hybrid Crossfire, denn um nichts anderes handelt es sich: Dual Graphics ist eine asynchrone Variante des 2005 erstmals vorgestellten Crossfire , einer Technik, um mit zwei oder mehr Grafikkarten gemeinsam Spiele oder Compute-Anwendungen zu berechnen. Asynchron deswegen, weil bei gewöhnlichem Crossfire mit dedizierten Steckkarten nur Modelle mit dem gleichen Chip verwendet werden können - also beispielsweise zwei Radeon R9 290X oder eine R9 290X und eine R9 290.

Einrichtung und Besonderheiten

Um Dual Graphics mit Kaveri nutzen zu können, muss neben einer APU eine Grafikkarte mit Oland-Chip und DDR3-Speicher verbaut werden - das grenzt die Auswahlmöglichkeiten auf die Radeon R7 240 und die R7 250 ein. Ist die dedizierte Grafikkarte im System verbaut, so muss das Monitorkabel daran angeschlossen werden, um Leistungseinbußen zu verhindern. Ist es hingegen mit dem Bildschirmausgang des Mainboards verbunden, so verringert sich die Bildrate messbar - in Tomb Raider erreichten wir nur noch 44 statt 49 fps.

Nach der Installation des aktuellen Catalyst-Treibers(öffnet im neuen Fenster) ist Dual Graphics automatisch eingeschaltet - unter den Menüpunkten "Gaming" und "Performance" befindet sich im Control Center ein Schalter, um die Technik zu deaktivieren oder sie für jede Anwendung zu erzwingen. Anders als noch vor zwei Jahren ist kein Catalyst Application Profile notwendig, dieses ist mittlerweile im Treiber integriert.

Benchmarks und Leistungsaufnahme

Für unseren Test von Dual Graphics haben wir erneut einen A8-7600 mit 45 Watt verwendet, dessen integrierte R7-Grafikeinheit mit 384 Shader-Einheiten kein Vollbau ist - er bietet 512 ALUs und wird nur bei den A10-Kaveris eingesetzt. Die geringere Anzahl an Shader-Einheiten ermöglicht dafür einen größeren prozentualen Leistungszuwachs durch Dual Graphics, weswegen unsere Testkonfiguration das volle Potenzial der Technik zeigen kann. Die gilt auch für die Frametimes, dazu später mehr.

Als Testkarten verwenden wir eine passive Radeon R7 240 von XFX(öffnet im neuen Fenster) im Low-Profile-Format und eine aktiv gekühlte Radeon R7 250 von Sapphire(öffnet im neuen Fenster) .

Dual-Graphics-Spezifikationen
Radeon R7 im A8-7600 Radeon R7 240 Radeon R7 250
Codename Spectre Pro Oland Pro Oland XT
Shadereinheiten 384 320 384
Chiptakt 720 MHz 780 MHz 1.050 MHz
SP-GFLOPS 553 499 806
Speicherinterface 128 Bit 128 Bit 128 Bit
Speichertakt 1.066 MHz 900 MHz 1.150 MHz
Datentransfer-Rate 34 GB/s 29 GB/s 36,8 GB/s

Die Llano-Generation unterstützte nur Dual Graphics mit Direct3D 10 oder höher, D3D9 sowie OpenGL und OpenCL nicht. Die aktuelle Version der Technik hingegen ist zu jeglichen Schnittstellen kompatibel, selbst Battlefield 4 mit dem Mantle-API wird durch Dual Graphics beschleunigt.

Unsere Messungen belegen, dass die Radeon R7 250 zusammen mit der R7-Grafikeinheit des Kaveri-A8 die Bildrate in Spielen im Vergleich zur integrierten GPU allein um bis zu 88 Prozent (in Tomb Raider) steigert. Auch Titel wie Battlefield 4, Crysis 3 oder Skyrim profitieren deutlich - bei Borderlands 2 hingegen bremst die Speicherbandbreite, und bei Trine 2 funktioniert Crossfire nur rudimentär. Daher ist die Radeon R7 250 schneller als mit Dual Graphics.

Der Firestrike-Test des 3D Mark, genauer gesagt der Graphics Score, skaliert wie erwartet sehr gut mit Dual Graphics. Mit fast 2.600 Punkten erreicht das Crossfire-Gespann die Werte einer Radeon R7 250X . Besonders beeindruckend fällt die verdoppelte Leistung beim Sala-Test des Luxmark aus. Dieser Raytracer ist ideal für zwei GPUs, da die Strahlen durchweg parallel berechnet werden und anders als bei einem Spiel keine Synchronisierungsschritte vorhanden sind, die eine lineare Skalierung verhindern. Kurioses Detail: Die Radeon R7 250 alleine ist schneller als im Doppel mit der integrierten R7-Grafikeinheit.

Leistungsaufnahme

Eine dedizierte Karte im System benötigt natürlich elektrische Energie, weswegen die Leistungsaufnahme im Leerlauf wie unter Last ansteigt. Unser Testsystem basiert erneut auf der sparsamen Mini-ITX-Platine GA-F2A88XN-WIFI von Gigabyte, als Netzteil dient das effiziente Be Quiet Straight Power E9 mit 400 Watt und 80-Plus-Gold-Zertifizierung .

Ist Dual Graphics aktiviert und das Monitorkabel an der dedizierten Grafikkarte angeschlossen, greift Zero Core und der Lüfter der R7 250 schaltet sich ab. Der Desktop wird im Leerlauf von der integrierten R7-Grafik dargestellt und das Displaysignal durchgeschliffen. Dual Graphics ist daher sparsamer, als wenn nur die Radeon R7 250 aktiv ist. Unter Last gibt es nur eine Auffälligkeit: Die Leistung pro Watt steigt durch das asynchrone Crossfire leicht an.

Die Mikroruckler-Problematik

Crossfire und damit auch Dual Graphics arbeitet mit sogenanntem AFR (Alternate Frame Rendering), die GPUs berechnen also abwechselnd je einen Frame. Da die Last pro Bild unterschiedlich ausfällt und die Frames direkt nach ihrer Berechnung ausgegeben werden, ist die Frequenz unregelmäßig, und die Darstellung wirkt nicht flüssig - gerade bei niedrigen Bildraten. Dieses Problem wird als Mikroruckler bezeichnet. Entdeckt wurde es vom mittlerweile verstorbenen, legendären 3DC-Forenmitglied " tombman(öffnet im neuen Fenster) ".

Theoretisch sollte bei 60 fps jedes Frame nach 16,7 Millisekunden (diese Zeitspanne wird als Frametime bezeichnet) ausgegeben werden - dies ist aber bei mehreren GPUs oft nicht der Fall. Die Problematik ist bei asynchronem Crossfire besonders stark ausgeprägt, da sich beide GPUs hinsichtlich ihrer Geschwindigkeit unterscheiden. Die Radeon R7 250 etwa hat eine um fast 50 Prozent höhere Rechenleistung als die R7-Grafik des A8-Kaveri. Deshalb hat AMD die AFR-Technik für Dual Graphics angepasst: Die dedizierte GPU kann mehrere Bilder hintereinander ausgeben, dann ist die integrierte GPU an der Reihe, dann wieder Erstere und so weiter.

In der Praxis verbessert diese prinzipiell gute Idee zwar die absolut erreichte Bildrate, verstärkt aber das Mikroruckler-Problem massiv. Statt einer gleichmäßigen Frametime werden mehrere Frames innerhalb kürzester Zeit ausgegeben, danach folgt eine Pause und dann wieder ein Frame. Die Folge ist eine hohe Bildrate bei dennoch sehr unflüssigem, ruckeligem Spielgefühl. Bei Llano waren Titel wie Call of Duty Modern Warfare praktisch unspielbar, da dieses Spiel von einer hohen und gleichmäßigen Bildrate sehr profitiert (selbst auf Konsole läuft CoD daher mit 60 fps).

AMD hat deswegen eine Technik namens Frame Pacing erfunden, welche die Frame-Ausgabe bei Multi-GPU-Systemen optimiert, also gegen Mikroruckler vorgeht. Frame Pacing passt die Render Time und die Display Time an und hält finale Frames zurück, hierdurch wird eine regelmäßigere Bildrate erreicht. Die Technik funktioniert ergo nur im GPU-Limit und nicht, wenn die CPU bremst, da hier der Prozessor bestimmt, wann ein Bild ausgegeben wird (in diesem Fall treten keine Mikroruckler auf).

Frametime-Problematik gelöst, Fazit

Durch spezielle Hard- und Software wie Nvidias Frame Capture Analysis Tool(öffnet im neuen Fenster) (FCAT) ist Frame Pacing messbar, da diese Technik die tatsächlich am Bildschirm ankommenden Frames analysiert. Das beliebte Programm Fraps(öffnet im neuen Fenster) , das früher für Frametime-Messungen genutzt wurde, berücksichtigt Render Time und Display Time nicht. Derzeit steht Golem.de kein FCAT zur Verfügung, weswegen wir auf unsere langjährige Erfahrung zugreifen und einen subjektiven Eindruck von Frame Pacing liefern.

Insbesondere bei schnellen Spielen wie Battlefield 4 empfinden wir Frame Pacing als eine drastische Verbesserung, da die Frametimes deutlich gleichmäßiger wirken - ähnlich wie bei einer einzelnen starken Grafikkarte (wir haben als Vergleich die Bildrate einer R9 290X durch Untertakten auf 40 fps begrenzt). Die für flotte Shooter wichtige Eingabeverzögerung wird zwar nicht verringert, dafür erfolgt der Input gleichmäßiger. Dies ist für ein sauberes Anvisieren wichtig, beispielsweise bei genauen, aber schnellen Schüssen mit dem Präzisionsgewehr über große Entfernungen hinweg.

Zwei Nachteile hat Frame Pacing jedoch: Die Bildrate ist mit dieser Technik im niedrigen einstelligen Prozentbereich langsamer als ohne sie, da zurückgehaltene Frames die absoluten Frames per Second beeinflussen. Zudem funktioniert Frame Pacing derzeit nur mit D3D10 oder höher, nicht mit D3D9 - Skyrim etwa "mikroruckelt" fühlbar.

Fazit

Aller guten Dinge sind drei: Nach den kaum brauchbaren bis durchwachsenen Dual-Graphics-Versuchen mit Llano und Trinity respektive Richland hat AMD die asynchrone Crossfire-Technik durch Frame Pacing zu einer interessanten Möglichkeit geformt, um bei einem günstigen APU-System die Spieleleistung deutlich zu steigern.

Die Kombination aus einem A8-7600 und einer Radeon R7 250 liefert in 1080p mit mittleren Details eine Bildrate von rund 40 fps und damit teilweise die Geschwindigkeit einer Radeon R7 250X , einzig Crysis 3 ist zu anspruchsvoll für das Gespann. Die Leistungsaufnahme des Gesamtsystems erhöht sich zwar, die Effizienz ist jedoch besser als nur mit integrierter Grafikeinheit. Einzig die fehlende D3D9-Unterstützung trübt das Bild.


Relevante Themen