Abo
  • IT-Karriere:

Fehlender Cache verursacht Ruckler: Nvidias beschnittene Geforce GTX 970 stottert messbar

Die Geforce GTX 970 hat Probleme, wenn die letzten 512 MByte ihres 4 GByte großen Videospeichers genutzt werden: Nvidia nennt einen Leistungseinbruch im einstelligen Prozentbereich, Messwerte aber zeigen Ruckler und ein Drittel weniger Bilder pro Sekunde.

Artikel veröffentlicht am ,
Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Nachdem Nvidia korrigierte Spezifikationen für die Geforce GTX 970 bekanntgeben musste, haben sich die Kollegen der PCGH zwei Tage am Stück mit dem beschnittenen Videospeicher- und dem Cache-System der Maxwell-Grafikkarte beschäftigt, detaillierte Messungen inklusive.

Stellenmarkt
  1. BwFuhrparkService GmbH, Troisdorf
  2. OEDIV KG, Oldenburg

Das Resultat: Mit hohen Auflösungen und Kantenglättungsmodi stottert die Geforce GTX 970 durch unregelmäßige Frametimes, zudem sinkt die Leistung anders als bei der Geforce GTX 980 deutlich, wenn die volle Menge des verfügbaren Videospeichers genutzt wird.

Beide Grafikkarten bieten 4 GByte Videospeicher, die an ein 256-Bit-Interface angeschlossen sind. Die Speichermenge setzt sich aus acht 512 MByte großen GDDR5-Bausteinen zusammen, wovon zumindest bei der Geforce GTX 980 jeder durch 256 KByte L2-Cache gepuffert wird. Bei der Geforce GTX 970 hat Nvidia diesen schnellen Zwischenspeicher bei einem Speicherbaustein deaktiviert, es sind also nur 1.792 statt 2.048 KByte L2-Cache vorhanden.

Effektiv verfügt die Geforce GTX 970 somit über nur sieben GDDR5-Bausteine, die mit voller Geschwindigkeit angesprochen werden können. Daher versucht der Treiber, möglichst nur diese sieben Speicherchips zu nutzen, was einem 224-Bit-Interface mit 196 GByte pro Sekunde und 3.584 MByte Videospeicher entspricht. Auf dem Papier spricht Nvidia aber von einem 256-Bit-Interface mit 224 GByte pro Sekunde und 4.096 MByte Videospeicher.

Benötigt eine Anwendung oder ein Spiel mehr als 3.584 MByte Speicher, muss der Treiber (auch wenn er es zu vermeiden versucht) den letzten 512-MByte-Baustein adressieren. Da hier der L2-Cache fehlt, stauen sich die Daten und sie gelangen mit Verzögerung zu den Recheneinheiten - die Leistung sinkt.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)

Um das aufzuzeigen, hat PCGH eine Geforce GTX 980 auf 957 MHz heruntergetaktet, um die identische Shader- und Texturgeschwindigkeit einer Geforce GTX 970 (1.178 MHz) zu erreichen. Eine "echte" Geforce GTX 970 ohne beschnittenen L2-Cache wäre sogar schneller als die heruntergetaktete Geforce GTX 980, da die Frequenz die Raster- und Geometrie-Leistung verringert.

In Watch Dogs in Ultra-HD mit 4x MSAA und hohen Texturdetails rechnet die simulierte Geforce GTX 970 mit vollem MByte L2-Cache gut ein Drittel schneller als eine gewöhnliche Geforce GTX 970 mit beschnittenem L2-Puffer. Zugegeben: 15 statt 11 fps machen kaum einen Unterschied, zeigen aber gut, was passiert, wenn die letzten 512 MByte befüllt werden müssen.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)

Noch interessanter ist die Messung der Frametime: Diese sagt aus, wie viele Millisekunden die Grafikkarte benötigt, um einen Frame zu berechnen und auszugeben. Je länger das dauert und je unregelmäßiger, desto langsamer und vor allem ruckeliger läuft ein Spiel.

Die auf Basis der GTX 980 simulierte Geforce GTX 970 schickt regelmäßig alle 60 bis 70 Millisekunden ein Bild an den Monitor, die echte Geforce GTX 970 hingegen pendelt zwischen 60 bis über 150 Millisekunden. Auf dem Bildschirm resultiert diese ungleichmäßige Frame-Ausgabe in einem sichtbaren Stottern.

Was bedeutet das für die Geforce GTX 970? Sofern ein aktuelles oder kommendes Spiel zwischen 3.584 und 4.096 MByte an Videospeicher belegt, ruckelt es auf der Grafikkarte - selbst wenn Programme wie Fraps beispielsweise 60 Bilder pro Sekunde anzeigen. Gerade wer die Geforce GTX 970 zwei oder drei Jahre behalten möchte, dürfte das Stottern künftig zu Gesicht bekommen.

Nvidia arbeitet für den EMEA-Raum an einer Lösung für Käufer der Karte.

Geforce GTX 980Geforce GTX 970 (bisher)Geforce GTX 970 (neu)
GPCs444
SMMs161313
ALUs2.0481.6641.664
TMUs128104104
ROPs646456
L2-Cache2.048 KByte2.048 KByte1.792 KByte
Speicherinterface256 Bit256 Bit224 + 32 Bit
Speichertakt3,5 GHz GDDR53,5 GHz GDDR53,5 GHz GDDR5
Speichermenge4.096 MByte4.096 MByte3.584 + 512 MByte
Datentransfer-Rate224 GByte/s224 GByte/s196 + 28 GByte/s
Korrigierte Spezifikationen der Geforce GTX 970


Anzeige
Spiele-Angebote
  1. 3,99€
  2. 29,99€
  3. 2,99€
  4. (-87%) 1,99€

Maceo 09. Feb 2015

Sehe ich auch so, B-Ware für 99,- ;)

__fastcall 09. Feb 2015

.. und das Geld schon mal in eine Anzahlung für eine Ferienwohnung gesteckt. Ob es ein...

Ovaron 06. Feb 2015

Wortspiel beabsichtigt?

echnaton192 06. Feb 2015

Der Händler ist verpflichtet, den Mangel zu beheben oder, wenn das nicht möglich ist...

echnaton192 06. Feb 2015

Gainward ist egal. Dein Ansprechpartner ist der Händler. Reparatur wird nicht gehen, also...


Folgen Sie uns
       


Teamfight Tactics - Trailer (Gameplay)

Die Helden kämpfen automatisch, trotzdem sind Dota Unerlords und League of Legends: TeamfightTactics richtig spannende Games - die Golem.de im Video ausprobiert hat.

Teamfight Tactics - Trailer (Gameplay) Video aufrufen
Smarte Wecker im Test: Unter den Blinden ist der Einäugige König
Smarte Wecker im Test
Unter den Blinden ist der Einäugige König

Einen guten smarten Wecker zu bauen, ist offenbar gar nicht so einfach. Bei Amazons Echo Show 5 und Lenovos Smart Clock fehlen uns viele Basisfunktionen. Dafür ist einer der beiden ein besonders preisgünstiges und leistungsfähiges smartes Display.
Ein Test von Ingo Pakalski

  1. Nest Hub im Test Google vermasselt es 1A

Erdbeobachtung: Satelliten im Dienst der erneuerbaren Energien
Erdbeobachtung
Satelliten im Dienst der erneuerbaren Energien

Von oben ist der Blick auf die Erde am besten. Satelliten werden deshalb für die Energiewende eingesetzt: Mit ihnen lassen sich beispielsweise die Standorte für Windkraftwerke oder Solaranlagen bestimmen sowie deren Ertrag prognostizieren.
Ein Bericht von Jan Oliver Löfken

  1. Rocketlab Kleine Rakete wird wiederverwendbar und trotzdem teurer
  2. Space Data Highway Esa bereitet Laser-Kommunikationsstation für den Start vor
  3. Iridium Certus Satelliten-Breitbandnetz startet mit 350 bis 700 KBit/s

Indiegames-Rundschau: Epische ASCII-Abenteuer und erlebnishungrige Astronauten
Indiegames-Rundschau
Epische ASCII-Abenteuer und erlebnishungrige Astronauten

In Stone Story RPG erwacht ASCII-Art zum Leben, die Astronauten in Oxygen Not Included erleben tragikomische Slapstick-Abenteuer, dazu kommen Aufbaustrategie plus Action und Sammelkartenspiele: Golem.de stellt neue Indiegames vor.
Von Rainer Sigl

  1. Indiegames-Rundschau Von Bananen und Astronauten
  2. Indiegames-Rundschau Verloren im Sonnensystem und im Mittelalter
  3. Indiegames-Rundschau Drogen, Schwerter, Roboter-Ritter

    •  /