D3D12-Benchmark: Async Compute macht AMD schneller und Nvidia langsamer

Oxide Games' neue Version von Ashes of the Singularity zeigt: Direct3D 12 kann die Leistung durch Async Compute für Grafikkarten und besseres Multithreading für CPUs drastisch erhöhen. Die prinzipiell spannende Multi-Adapter-Option hingegen überzeugt uns nicht.

Artikel veröffentlicht am ,
Ashes of the Singularity
Ashes of the Singularity (Bild: Marc Sauter/Golem.de)

Mehr Einheiten, mehr Effekte, mehr Direct3D 12: Oxide Games hat das Strategiespiel Ashes of the Singularity in den vergangenen Monaten kräftig aufgehübscht und vor allem die D3D12-Implementierung verbessert. Dazu zählen die verstärkte Nutzung von Async Shadern und Multithreading für die Command Buffer, was Grafikkarten wie Prozessoren zu mehr Geschwindigkeit verhelfen soll - und in der Praxis eindrucksvoll klappt.

Stellenmarkt
  1. Informatiker (Fachinformatiker) als Softwareentwickler (m/w/d) für C#
    Connext Communication GmbH, Paderborn
  2. (Wirtschafts-)Informatikerin als IT-Serviceverantwortliche (m/w/d) für den Bereich Netzwerk
    Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V., München
Detailsuche

Wir konnten vorab auf die enorm umfangreichen Messwerte der Computerbase zurückgreifen, die mit dem neuen Benchmark v2 entstanden sind, der Teil von Ashes of the Singularity ist. Verglichen mit der ersten Version des internen Benchmarks hat Oxide Games die zweite Iteration und das Spiel generell überarbeitet. Die Szene zeigt wie gehabt das Endgame mit sehr vielen Einheiten, aber sichtbar mehr und klar besseren Effekten sowie Texturen.

Eine der spannendsten Neuerungen ist Async Compute oder genauer, der laut Oxide Games weitaus häufigere Einsatz von Async Shadern. Bei AMD-Grafikkarten sind bei allen Modellen mit GCN-Architektur (Graphics Core Next, an Radeon HD 7000) sogenannte Asynchronous Compute Engines verbaut, welche Warteschlangen mit Compute- und Grafik-Befehlen parallel in Hardware abarbeiten können. Nvidia-Karten haben die optionale D3D12-Funktion anders implementiert, was in Ashes of the Singularity sichtbar wird.

Während AMDs Radeon-Modelle fast durch die Bank durch Async Compute rund 10 Prozent an Leistung gewinnen, büßen jegliche Nvidia-Grafikkarten ein bisschen an Geschwindigkeit ein. Zusammen mit weiteren Optimierungen zeigt Ashes of the Singularity daher ein recht ungewöhnlicher Anblick: Eine Fury X erreicht unter D3D12 in allen Auflösungen mit hohen oder exremen Details rund 25 Prozent mehr Bilder pro Sekunde (68 statt 54 fps) als eine Geforce GTX 980 Ti, die von einer sonst klar langsameren Radeon R9 390X eingeholt wird.

Golem Akademie
  1. Entwicklung mit Unity auf der Microsoft HoloLens 2 Plattform: virtueller Zwei-Tage-Workshop
    7.–8. Februar 2022, Virtuell
  2. Cloud Computing mit Amazon Web Services (AWS): virtueller Drei-Tage-Workshop
    14.–16. Februar 2022, virtuell
Weitere IT-Trainings

Die 310 Euro teure Geforce GTX 970 wiederum liegt nur gleichauf mit einer Radeon R9 380X, die schon für 230 Euro zu haben ist. Diese Werte gelten allerdings nur unter Windows 10 mit D3D12, denn unter Direct3D 11 schneiden die Nvidia-Modelle deutlich besser ab und überholen die genannten AMD-Pendants. Hintergrund dürfte die unter D3D11 im CPU-Limit durch viele Draw-Calls schwache Radeon-Software sein. Dafür spricht, dass der Abstand von D3D12 zu D3D11 mit steigender Draw-Call-Anzahl brav skaliert.

Multi-Adapter skaliert mäßig, Multithreading dagegen gut

Sehr interessant, zumindest theoretisch, ist eine D3D12-Funktion namens Unlinked-Multi-Adapter: Die muss explizit vom Entwickler eingebaut werden und ermöglicht es, unterschiedliche Grafikkarten zu koppeln. Das gilt für eine langsame und eine schnelle Karte eines Herstellers ebenso wie für eine Geforce mit einer Radeon oder einer iGPU von Intel. Das klappt erstaunlich gut, die Skalierung ist aber trotz Alternate Frame Rendering CPU-limitiert: Wird eine Geforce GTX 980 mit einer Radeon R9 390X kombiniert, steigt die Leistung je nach Basiskarte um 50 bis 65 Prozent. Interessant dürfte werden, wie sich ein aktuelles Modell kombiniert mit einem älteren schlägt.

Apropos älter: AMDs FX-Prozessoren erleben durch Direct3D 12 eine Art zweiten Frühling. Statt mit rund 35 Prozent Differenz hoffnungslos unter D3D11 abgeschlagen zu sein, erreicht ein FX-8370 unter D3D12 fast die Leistung des sonst viel flotteren Core i5-4690. An den schnellen und teuren Core i7-6700K kommt der FX zwar nicht heran. Dennoch gefällt uns die gebotene Geschwindigkeit, insbesondere bei vielen Draw-Calls.

Was bleibt, ist ein auf reinen AMD-Systemen beeindruckender Leistungszuwachs durch D3D12, was bei einem Gaming-Evolved-Titel nicht überrascht. Wir sind gespannt, ob sich Ashes of the Singularity als Einzelfall entpuppt, oder ob Spiele wie Hitman ebenfalls solche Resultate aufweisen werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anonymer Nutzer 25. Feb 2016

Naja, also als ich mal meine Grafikkarte berechnet habe, da ging es um entweder GTX960...

Spiritogre 25. Feb 2016

Ich nutze sowohl NVidia als auch AMD Karten. Rein von der Preis / Leistung bevorzuge ich...

NeoTiger 25. Feb 2016

Nach anfänglichem Hype aufgrund von Marketing-Versprechen über neue Performance-Welten...



Aktuell auf der Startseite von Golem.de
Krypto-Währung
El Salvador nutzt Talfahrt des Bitcoin für großen Ankauf

Die selbsternannte Bitcoin-Nation El Salvador hat die aktuelle Schwäche der Währung ausgenutzt und eingekauft - offenbar am Smartphone.

Krypto-Währung: El Salvador nutzt Talfahrt des Bitcoin für großen Ankauf
Artikel
  1. Radeon RX 6500 XT: Diese Karte hätte es früher(TM) nie gegeben
    Radeon RX 6500 XT
    Diese Karte hätte es früher(TM) nie gegeben

    In Zeiten irrer Grafikkarten-Preise wird ein winziger Laptop- als überteuerter Gaming-Desktop-Chip verkauft. Eine ebenso perfide wie geniale Idee.
    Eine Analyse von Marc Sauter

  2. Wissenschaft: Wie Malware mit der Antenne erkannt werden kann
    Wissenschaft
    Wie Malware mit der Antenne erkannt werden kann

    IoT-Geräte sind mit steigender Verbreitung ein beliebtes Ziel für Malware. Französische Forschende erkennen sie auf unkonventionelle Weise.
    Von Johannes Hiltscher

  3. Serielle Schnittstellen: Wie funktioniert PCI Express?
    Serielle Schnittstellen
    Wie funktioniert PCI Express?

    Serielle High-Speed-Links erscheinen irgendwie magisch. Wir erklären am Beispiel von PCI Express, welche Techniken sie ermöglichen - und warum.
    Von Johannes Hiltscher

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • RTX 3080 Ti 12GB 1.699€ • Intel i9-10900K 444,88€ • Huawei Curved Gaming-Monitor 27" 299€ • Hisense-TVs zu Bestpreisen (u. a. 55" OLED 739€) • RX 6900 1.449€ • MindStar (u.a. Intel i7-10700KF 279€) • 4 Blu-rays für 22€ • LG OLED (2021) 77 Zoll 120Hz 2.799€ [Werbung]
    •  /