Abo
  • Services:

Fehlender Cache verursacht Ruckler: Nvidias beschnittene Geforce GTX 970 stottert messbar

Die Geforce GTX 970 hat Probleme, wenn die letzten 512 MByte ihres 4 GByte großen Videospeichers genutzt werden: Nvidia nennt einen Leistungseinbruch im einstelligen Prozentbereich, Messwerte aber zeigen Ruckler und ein Drittel weniger Bilder pro Sekunde.

Artikel veröffentlicht am ,
Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Nachdem Nvidia korrigierte Spezifikationen für die Geforce GTX 970 bekanntgeben musste, haben sich die Kollegen der PCGH zwei Tage am Stück mit dem beschnittenen Videospeicher- und dem Cache-System der Maxwell-Grafikkarte beschäftigt, detaillierte Messungen inklusive.

Stellenmarkt
  1. Robert Bosch GmbH, Leonberg
  2. Robert Bosch GmbH, Abstatt

Das Resultat: Mit hohen Auflösungen und Kantenglättungsmodi stottert die Geforce GTX 970 durch unregelmäßige Frametimes, zudem sinkt die Leistung anders als bei der Geforce GTX 980 deutlich, wenn die volle Menge des verfügbaren Videospeichers genutzt wird.

Beide Grafikkarten bieten 4 GByte Videospeicher, die an ein 256-Bit-Interface angeschlossen sind. Die Speichermenge setzt sich aus acht 512 MByte großen GDDR5-Bausteinen zusammen, wovon zumindest bei der Geforce GTX 980 jeder durch 256 KByte L2-Cache gepuffert wird. Bei der Geforce GTX 970 hat Nvidia diesen schnellen Zwischenspeicher bei einem Speicherbaustein deaktiviert, es sind also nur 1.792 statt 2.048 KByte L2-Cache vorhanden.

Effektiv verfügt die Geforce GTX 970 somit über nur sieben GDDR5-Bausteine, die mit voller Geschwindigkeit angesprochen werden können. Daher versucht der Treiber, möglichst nur diese sieben Speicherchips zu nutzen, was einem 224-Bit-Interface mit 196 GByte pro Sekunde und 3.584 MByte Videospeicher entspricht. Auf dem Papier spricht Nvidia aber von einem 256-Bit-Interface mit 224 GByte pro Sekunde und 4.096 MByte Videospeicher.

Benötigt eine Anwendung oder ein Spiel mehr als 3.584 MByte Speicher, muss der Treiber (auch wenn er es zu vermeiden versucht) den letzten 512-MByte-Baustein adressieren. Da hier der L2-Cache fehlt, stauen sich die Daten und sie gelangen mit Verzögerung zu den Recheneinheiten - die Leistung sinkt.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)

Um das aufzuzeigen, hat PCGH eine Geforce GTX 980 auf 957 MHz heruntergetaktet, um die identische Shader- und Texturgeschwindigkeit einer Geforce GTX 970 (1.178 MHz) zu erreichen. Eine "echte" Geforce GTX 970 ohne beschnittenen L2-Cache wäre sogar schneller als die heruntergetaktete Geforce GTX 980, da die Frequenz die Raster- und Geometrie-Leistung verringert.

In Watch Dogs in Ultra-HD mit 4x MSAA und hohen Texturdetails rechnet die simulierte Geforce GTX 970 mit vollem MByte L2-Cache gut ein Drittel schneller als eine gewöhnliche Geforce GTX 970 mit beschnittenem L2-Puffer. Zugegeben: 15 statt 11 fps machen kaum einen Unterschied, zeigen aber gut, was passiert, wenn die letzten 512 MByte befüllt werden müssen.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)

Noch interessanter ist die Messung der Frametime: Diese sagt aus, wie viele Millisekunden die Grafikkarte benötigt, um einen Frame zu berechnen und auszugeben. Je länger das dauert und je unregelmäßiger, desto langsamer und vor allem ruckeliger läuft ein Spiel.

Die auf Basis der GTX 980 simulierte Geforce GTX 970 schickt regelmäßig alle 60 bis 70 Millisekunden ein Bild an den Monitor, die echte Geforce GTX 970 hingegen pendelt zwischen 60 bis über 150 Millisekunden. Auf dem Bildschirm resultiert diese ungleichmäßige Frame-Ausgabe in einem sichtbaren Stottern.

Was bedeutet das für die Geforce GTX 970? Sofern ein aktuelles oder kommendes Spiel zwischen 3.584 und 4.096 MByte an Videospeicher belegt, ruckelt es auf der Grafikkarte - selbst wenn Programme wie Fraps beispielsweise 60 Bilder pro Sekunde anzeigen. Gerade wer die Geforce GTX 970 zwei oder drei Jahre behalten möchte, dürfte das Stottern künftig zu Gesicht bekommen.

Nvidia arbeitet für den EMEA-Raum an einer Lösung für Käufer der Karte.

Geforce GTX 980Geforce GTX 970 (bisher)Geforce GTX 970 (neu)
GPCs444
SMMs161313
ALUs2.0481.6641.664
TMUs128104104
ROPs646456
L2-Cache2.048 KByte2.048 KByte1.792 KByte
Speicherinterface256 Bit256 Bit224 + 32 Bit
Speichertakt3,5 GHz GDDR53,5 GHz GDDR53,5 GHz GDDR5
Speichermenge4.096 MByte4.096 MByte3.584 + 512 MByte
Datentransfer-Rate224 GByte/s224 GByte/s196 + 28 GByte/s
Korrigierte Spezifikationen der Geforce GTX 970


Anzeige
Hardware-Angebote
  1. und Vive Pro vorbestellbar
  2. für 147,99€ statt 259,94€
  3. bei Alternate.de

Maceo 09. Feb 2015

Sehe ich auch so, B-Ware für 99,- ;)

__fastcall 09. Feb 2015

.. und das Geld schon mal in eine Anzahlung für eine Ferienwohnung gesteckt. Ob es ein...

Ovaron 06. Feb 2015

Wortspiel beabsichtigt?

echnaton192 06. Feb 2015

Der Händler ist verpflichtet, den Mangel zu beheben oder, wenn das nicht möglich ist...

echnaton192 06. Feb 2015

Gainward ist egal. Dein Ansprechpartner ist der Händler. Reparatur wird nicht gehen, also...


Folgen Sie uns
       


AMD Ryzen 7 2700X - Test

Wie gut ist der Ryzen-Refresh? In Anwendungen schlägt er sich sehr gut und ist in Spielen oft überraschend flott. Besonders schön: die Abwärtskompatibilität.

AMD Ryzen 7 2700X - Test Video aufrufen
Thermalright ARO-M14 ausprobiert: Der den Ryzen kühlt
Thermalright ARO-M14 ausprobiert
Der den Ryzen kühlt

Mit dem ARO-M14 bringt Thermalright eine Ryzen-Version des populären HR-02 Macho Rev B. Der in zwei Farben erhältliche CPU-Kühler leistet viel und ist leise, zudem hat Thermalright die Montage etwas verbessert.
Ein Hands on von Marc Sauter


    Datenverkauf bei Kommunen: Öffentliche Daten nicht verhökern, sondern sinnvoll nutzen
    Datenverkauf bei Kommunen
    Öffentliche Daten nicht verhökern, sondern sinnvoll nutzen

    Der Städte- und Gemeindebund hat vorgeschlagen, Kommunen sollten ihre Daten verkaufen. Wie man es auch dreht und wendet: Es bleibt eine schlechte Idee.
    Ein IMHO von Michael Peters und Walter Palmetshofer

    1. Gerichtsurteil Kein Recht auf anonyme IFG-Anfrage in Rheinland-Pfalz
    2. CDLA Linux Foundation veröffentlicht Open-Data-Lizenzen
    3. Deutscher Wetterdienst Wetterdaten sind jetzt Open Data

    Datenschutz: Der Nutzer ist willig, doch die AGB sind schwach
    Datenschutz
    Der Nutzer ist willig, doch die AGB sind schwach

    Verbraucher verstehen die Texte oft nicht wirklich, in denen Unternehmen erklären, wie ihre Daten verarbeitet werden. Datenschutzexperten und -forscher suchen daher nach praktikablen Lösungen.
    Ein Bericht von Christiane Schulzki-Haddouti

    1. Soziales Netzwerk Facebook will in Deutschland Vertrauen wiedergewinnen
    2. Denial of Service Facebook löscht Cybercrime-Gruppen mit 300.000 Mitgliedern
    3. Facebook-Anhörung Zuckerbergs Illusion von der vollen Kontrolle

      •  /