Fehlender Cache verursacht Ruckler: Nvidias beschnittene Geforce GTX 970 stottert messbar

Die Geforce GTX 970 hat Probleme, wenn die letzten 512 MByte ihres 4 GByte großen Videospeichers genutzt werden: Nvidia nennt einen Leistungseinbruch im einstelligen Prozentbereich, Messwerte aber zeigen Ruckler und ein Drittel weniger Bilder pro Sekunde.

Artikel veröffentlicht am ,
Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Nachdem Nvidia korrigierte Spezifikationen für die Geforce GTX 970 bekanntgeben musste, haben sich die Kollegen der PCGH zwei Tage am Stück mit dem beschnittenen Videospeicher- und dem Cache-System der Maxwell-Grafikkarte beschäftigt, detaillierte Messungen inklusive.

Stellenmarkt
  1. Vehicle Systems Architect (f/m/d)
    Aptiv Services Deutschland GmbH, Wuppertal
  2. Technischer Produktmanager (m/w/d)
    CCV GmbH, Au in der Hallertau
Detailsuche

Das Resultat: Mit hohen Auflösungen und Kantenglättungsmodi stottert die Geforce GTX 970 durch unregelmäßige Frametimes, zudem sinkt die Leistung anders als bei der Geforce GTX 980 deutlich, wenn die volle Menge des verfügbaren Videospeichers genutzt wird.

Beide Grafikkarten bieten 4 GByte Videospeicher, die an ein 256-Bit-Interface angeschlossen sind. Die Speichermenge setzt sich aus acht 512 MByte großen GDDR5-Bausteinen zusammen, wovon zumindest bei der Geforce GTX 980 jeder durch 256 KByte L2-Cache gepuffert wird. Bei der Geforce GTX 970 hat Nvidia diesen schnellen Zwischenspeicher bei einem Speicherbaustein deaktiviert, es sind also nur 1.792 statt 2.048 KByte L2-Cache vorhanden.

Effektiv verfügt die Geforce GTX 970 somit über nur sieben GDDR5-Bausteine, die mit voller Geschwindigkeit angesprochen werden können. Daher versucht der Treiber, möglichst nur diese sieben Speicherchips zu nutzen, was einem 224-Bit-Interface mit 196 GByte pro Sekunde und 3.584 MByte Videospeicher entspricht. Auf dem Papier spricht Nvidia aber von einem 256-Bit-Interface mit 224 GByte pro Sekunde und 4.096 MByte Videospeicher.

Golem Karrierewelt
  1. Jira für Anwender: virtueller Ein-Tages-Workshop
    29.09.2022, virtuell
  2. Azure und AWS Cloudnutzung absichern: virtueller Zwei-Tage-Workshop
    22./23.09.2022, virtuell
Weitere IT-Trainings

Benötigt eine Anwendung oder ein Spiel mehr als 3.584 MByte Speicher, muss der Treiber (auch wenn er es zu vermeiden versucht) den letzten 512-MByte-Baustein adressieren. Da hier der L2-Cache fehlt, stauen sich die Daten und sie gelangen mit Verzögerung zu den Recheneinheiten - die Leistung sinkt.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)

Um das aufzuzeigen, hat PCGH eine Geforce GTX 980 auf 957 MHz heruntergetaktet, um die identische Shader- und Texturgeschwindigkeit einer Geforce GTX 970 (1.178 MHz) zu erreichen. Eine "echte" Geforce GTX 970 ohne beschnittenen L2-Cache wäre sogar schneller als die heruntergetaktete Geforce GTX 980, da die Frequenz die Raster- und Geometrie-Leistung verringert.

In Watch Dogs in Ultra-HD mit 4x MSAA und hohen Texturdetails rechnet die simulierte Geforce GTX 970 mit vollem MByte L2-Cache gut ein Drittel schneller als eine gewöhnliche Geforce GTX 970 mit beschnittenem L2-Puffer. Zugegeben: 15 statt 11 fps machen kaum einen Unterschied, zeigen aber gut, was passiert, wenn die letzten 512 MByte befüllt werden müssen.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)

Noch interessanter ist die Messung der Frametime: Diese sagt aus, wie viele Millisekunden die Grafikkarte benötigt, um einen Frame zu berechnen und auszugeben. Je länger das dauert und je unregelmäßiger, desto langsamer und vor allem ruckeliger läuft ein Spiel.

Die auf Basis der GTX 980 simulierte Geforce GTX 970 schickt regelmäßig alle 60 bis 70 Millisekunden ein Bild an den Monitor, die echte Geforce GTX 970 hingegen pendelt zwischen 60 bis über 150 Millisekunden. Auf dem Bildschirm resultiert diese ungleichmäßige Frame-Ausgabe in einem sichtbaren Stottern.

Was bedeutet das für die Geforce GTX 970? Sofern ein aktuelles oder kommendes Spiel zwischen 3.584 und 4.096 MByte an Videospeicher belegt, ruckelt es auf der Grafikkarte - selbst wenn Programme wie Fraps beispielsweise 60 Bilder pro Sekunde anzeigen. Gerade wer die Geforce GTX 970 zwei oder drei Jahre behalten möchte, dürfte das Stottern künftig zu Gesicht bekommen.

Nvidia arbeitet für den EMEA-Raum an einer Lösung für Käufer der Karte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Geforce GTX 980Geforce GTX 970 (bisher)Geforce GTX 970 (neu)
GPCs444
SMMs161313
ALUs2.0481.6641.664
TMUs128104104
ROPs646456
L2-Cache2.048 KByte2.048 KByte1.792 KByte
Speicherinterface256 Bit256 Bit224 + 32 Bit
Speichertakt3,5 GHz GDDR53,5 GHz GDDR53,5 GHz GDDR5
Speichermenge4.096 MByte4.096 MByte3.584 + 512 MByte
Datentransfer-Rate224 GByte/s224 GByte/s196 + 28 GByte/s
Korrigierte Spezifikationen der Geforce GTX 970


Aktuell auf der Startseite von Golem.de
Google Fonts
Abmahnungen an Webseitenbetreiber mit Google-Schriftarten

Nach einer Entscheidung des Landgerichts München erhalten Webseitenbetreiber mit eingebundenen Google Fonts vermehrt Abmahnungen.

Google Fonts: Abmahnungen an Webseitenbetreiber mit Google-Schriftarten
Artikel
  1. Sicherheitslücke: Gematik untersagt Videoident-Verfahren bei Krankenkassen
    Sicherheitslücke
    Gematik untersagt Videoident-Verfahren bei Krankenkassen

    Die Krankenkassen dürfen vorerst keine Personen mehr per Videodienst identifizieren. Offenbar gibt es Sicherheitsprobleme.

  2. Programmiersprache: JSON-Erfinder will Javascript in Rente schicken
    Programmiersprache
    JSON-Erfinder will Javascript in Rente schicken

    Douglas Crockford, der Erfinder des Datenformats JSON und Mitentwickler von Javascript, findet, dass die Sprache in Rente geschickt werden sollte.

  3. Gehalt in der IT-Branche: Verdienen treue Angestellte weniger als Wechsler?
    Gehalt in der IT-Branche
    Verdienen treue Angestellte weniger als Wechsler?

    Es gibt gute Gründe, lang bei einer Firma zu bleiben. Finanziell wird diese Treue aber eher nicht belohnt, sagt ein IT-Personalberater.
    Ein Interview von Peter Ilg

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Günstig wie nie: WD SSD 1TB m. Kühlkörper (PS5) 119,90€, MSI 29,5" 200 Hz 259€, LG QNED 75" 120 Hz 1.455,89€ • MindStar (XFX RX 6950 XT 999€, Gainward RTX 3070 559€) • Gigabyte Deals • Der beste Gaming-PC für 2.000€ • Apple Week bei Media Markt • be quiet! Deals [Werbung]
    •  /