Theorie und Testsystem

Mantle bietet einen verringerten Overhead und mehr Kontrolle: Die Command Buffer, welche die Schnittstelle auf Wunsch selbstständig anlegt, ermöglichen zusammen mit der nahezu linearen Skalierung über viele CPU-Kerne ein besseres Multithreading. Ein Command Buffer ist einer von vielen Speicherbereichen, die vom Prozessor erstellt, in einer Warteschlange verschachtelt und sortiert werden.

Anschließend führt die GPU die gespeicherten Befehle als sogenannten Draw Call - also Aufrufe, ein Objekt zu rendern - aus. Unter Direct3D bestimmt der Treiber, welcher Teil des Chips angesprochen wird, unter Mantle hingegen definiert der Entwickler, welche Command Buffer parallel berechnet und synchronisiert werden.

Die CPU ist kein Flaschenhals mehr

Jeder Draw Call kostet die CPU Rechenzeit, unter Direct3D sind diese Befehle zudem nicht sonderlich gut parallelisiert. Mantle ermöglicht eine drastisch höhere Anzahl an Draw Calls, um entweder mehr Befehle pro Frame vorzugeben oder bei gleicher Bildrate mehr Objekte darzustellen. Mantle ermöglicht es der CPU also, in der gleichen Zeit mehr Draw Calls an die Grafikkarte zu schicken.

  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
  • Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)
Oxide Games' Präsentation zur Nitrous-Engine und dem Mantle-API (Bild: AMD)

Dadurch, dass die CPU mehr Command Buffer und Draw Calls zugleich auf vielen Kernen ausführen kann, beliefert sie die GPU schneller mit Daten und die Geschwindigkeit des Systems steigt messbar an. Hinzu kommen weitere Verbesserungen wie beispielsweise der Verzicht auf eine Neukompilierung von Runtime-Shadern. Mantle sorgt somit in prozessorlimitierten Spielen oder Szenen für eine höhere Bildrate, also beispielsweise in den Mehrspielergefechten von Battlefield 4.

Weniger Leistungszuwachs bei hoher Grafiklast

Der beste Prozessor bringt nur wenig, wenn er zwar Daten aufbereiten, die Grafikkarte diese aber nicht schnell genug berechnen kann. Daher hat AMD mit Mantle den DMA-Zugriff ("Direct Memory Access") auf den Speicher entkoppelt, dieser arbeitet also asynchron. Gleiches gilt für die Warteschlangen von Grafik- und Compute-Befehlen, dadurch wird die GPU etwas besser ausgelastet.

Hinzu kommt die auf zwei Ressourcen vereinfachte Verwaltung, wodurch im Endeffekt auch die Leistung im Grafiklimit etwas steigt. Zugleich bietet Mantle mehr Kontrolle über die Frame-Ausgabe, diese erfolgt bei entsprechender Programmierung gleichmäßiger als unter Direct3D.

  • 64 Spieler, Ultra Details, FoV @ 90 Grad (Core i7-3770K, 16 GB DDR3-1333, Radeon R9 290X @ 1.000/2.500 MHz, Windows 8.1 x64, Catalyst 14.1 Beta)
  • Extreme Details (Core i7-3770K, 16 GB DDR3-1333, Radeon R9 290X @ 1.000/2.500 MHz, Windows 8.1 x64, Catalyst 14.1 Beta)
  • Mantle im Vergleich mit Direct3D (Screenshot: Marc Sauter/Golem.de)
  • Der Catalyst 14.1 Beta gibt sich intern als 13.35 aus. (Screenshot: Marc Sauter/Golem.de)
  • Unsere Testszene: Eine Jetski-Fahrt quer über die BF4-Map Siege of Shanghai (Screenshot: Marc Sauter/Golem.de)
  • Die großen Weltraumschlachten von Star Swarm nutzen sehr viele Draw Calls. (Screenshot: Marc Sauter/Golem.de)
Der Catalyst 14.1 Beta gibt sich intern als 13.35 aus. (Screenshot: Marc Sauter/Golem.de)

Die Testplattform

Als Basis unserer Messungen dienen ein Core i7-3770K mit 16 GByte DDR3-1333-Arbeitsspeicher und eine Sapphire Radeon R9 290X, die wir auf die Referenzfrequenzen von 1.000/2.500 MHz (Uber-Mode) heruntertakten. Als Betriebssystem kommt Windows 8.1 in der 64-Bit-Version zum Einsatz, der Grafikkarten-Treiber Catalyst 14.1 Beta liefert die Mantle-Unterstützung.

Das für Messungen der Bildrate beliebte Programm Fraps funktioniert unter Mantle nicht. Bei Battlefield 4 nutzen wir daher den spieleigenen Konsolenbefehl "PerfOverlay.FrameFileLogEnable". Dieser gibt aus, wie viele Millisekunden es dauert, bis ein Frame berechnet ist - dadurch ist die Bildrate pro Sekunde ableitbar. Star Swarm verfügt über eine integrierte Benchmark-Funktion.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 AMDs Mantle-API im Test: Der Prozessor-KatalysatorBattlefield 4 Multiplayer-Benchmarks 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


QDOS 22. Mai 2014

Ist vielleicht immer noch ein Rätsel - aber witzig ist, dass 3Dfx damals für Glide das...

TuX12 06. Feb 2014

Viele Fehler in CPUs merkt man auch nicht direkt. Mal fällt z.B. der Temperatursensor...

jor 05. Feb 2014

Ja, das sehe ich genauso. Ich wollte nur darauf hinaus, dass die Berichterstattung über...

David64Bit 04. Feb 2014

Same here - das wird allerdings kommen und zwar wahrscheinlich recht bald. AMD ist da ja...



Aktuell auf der Startseite von Golem.de
KI im Programmierertest
Kann GPT-4 wirklich Code schreiben?

GPT-4 kann gut einfachen Code schreiben. Meine Tests mit schwierigeren Pfadfindungs- und Kollisionsalgorithmen hat es nicht bestanden. Und statt das einzugestehen, hat es lieber geraten.
Ein Erfahrungsbericht von Tyler Glaiel

KI im Programmierertest: Kann GPT-4 wirklich Code schreiben?
Artikel
  1. Nachfolger von CS GO: Counter-Strike 2 ist geleakt
    Nachfolger von CS GO
    Counter-Strike 2 ist geleakt

    Eigentlich steht CS 2 bisher nur ausgewählten Personen zur Verfügung. Eine davon hat die Spieldateien aber offenbar ins Internet hochgeladen.

  2. Hollywood-Autoren: KI soll Drehbücher schreiben dürfen
    Hollywood-Autoren
    KI soll Drehbücher schreiben dürfen

    Die Writers Guild of America hat vorgeschlagen, das Schreiben von Drehbüchern durch KI zuzulassen - solange dies keine Auswirkungen auf die Vergütung der Autoren hat.

  3. Code-Hoster: Github veröffentlicht privaten SSH-Schlüssel
    Code-Hoster
    Github veröffentlicht privaten SSH-Schlüssel

    Millionen von Entwicklern könnten bald MITM-Angriffen ausgesetzt sein, denn Github muss kurzfristig seinen SSH-Host-Key austauschen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Cyberport Jubiläums-Deals • MindStar: Gigabyte RTX 4080 OC 1.229€ • Nur noch heute: 38GB Allnet-Flat 12,99€/M. • NBB Black Weeks • Powercolor RX 7900 XTX 1.099€ • Crucial SSD 1TB/2TB (PS5) bis -50% • Amazon Smart TVs ab 189€ • Nintendo Switch + Spiel + Goodie 288€ • PS5 + RE4 569€ [Werbung]
    •  /