Abo
  • Services:
Anzeige
Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Maxwell-Grafikkarte: Nvidia korrigiert die Spezifikationen der Geforce GTX 970

Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Die Geforce GTX 970 spricht ihre 4 GByte ungewöhnlich an, die letzten 512 MByte sind sehr langsam. Mehrere im GM204-Chip deaktivierte Funktionseinheiten drosseln die Leistung der Maxwell-Grafikkarte, wie Nvidia unter Druck der Öffentlichkeit bekannt geben musste.

Anzeige

Nvidia hat bestätigt, dass die Geforce GTX 970 über eine andere Videospeicher-Verwaltung verfügt als die Geforce GTX 980. Dies geht jedoch nicht aus den bisher veröffentlichten Spezifikationen hervor. Auf dem Papier sollten beide Grafikkarten über ein identisches Speichersystem verfügen.

Mehrere Nutzer haben festgestellt, dass eine unregelmäßige Frametime für Ruckler verantwortlich ist, oder gar die Bildrate in Spielen einbricht, wenn zwischen 3,5 und 4 GByte des Videospeichers der Geforce GTX 970 belegt sind. Bei der GTX 980 tritt dieses Problem nicht auf, auch das hat Nvidia bestätigt.

Der Hersteller begründet die Ruckler mit der geringeren Anzahl an Shader-Blöcken und deren Anbindung an das Videospeichersystem über eine leistungsschwächere Crossbar, benennt aber keine Details. Theoretisch verfügen Geforce GTX 980 und GTX 970 beide über ein 256-Bit-Interface mit 4 GByte GDDR5-Speicher mit 3,5 GHz. Diese werden von 2 MByte L2-Cache gepuffert, dahinter sind 64 Raster-Endstufen (ROP) geschaltet.

Nun leidet die Geforce GTX 970 unter zwei Problemen: Messwerte zeigen, dass die Pixelfüllrate nicht 64, sondern 52 Raster-Endstufen entspricht. Da Nvidia angibt, die geringere Anzahl an Shader-Blöcken sei schuld, liegt die Vermutung nahe, dass bei der Maxwell-Architektur die Pixelfüllrate nicht durch die ROP-, sondern die Shader-Einheiten begrenzt wird, ähnlich wie bei Fermi.

Jedem der 16 Shader-Blöcke des Maxwell-Chips GM204 sind vier Raster-Endstufen zugeordnet, die wahrscheinlich wie bei Fermi und Kepler per 128-Bit-Bus mit den Shader-Blöcken verbunden sind. Bei nur 13 statt 16 Blöcken werden die ROPs in ihrer Leistung limitiert - die entspricht dann besagten 52 Raster-Endstufen. Die zusätzlichen 12 vorhandenen ROPs machen sich nur bemerkbar, wenn hohe Kantenglättungsmodi aktiviert sind, etwa 8x MSAA.

Die verglichen mit der Geforce GTX 980 geringere Pixelfüllrate der Geforce GTX 970 äußert sich jedoch schlicht in weniger Bildern pro Sekunde. Dies gilt vor allem bei älteren, nicht allzu Shader-lastigen Spielen oder in hohen Auflösungen wie Ultra-HD, bei Supersampling oder bei Downsampling.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)

Die reduzierte Pixelfüllrate erklärt nicht, warum die Geforce GTX 970 erst dann deutliche Ruckler zeigen soll, wenn mehr als 3,5 der 4 GByte Videospeicher verwendet werden. Auf der Grafikkarte sind acht Speicherchips verbaut, jeder davon hängt an einem 32-Bit-Interface. Zwei davon schaltet Nvidia zusammen, das macht vier 64-Bit-Controller und somit theoretisch ein 256-Bit-Speicherinterface bei der Geforce GTX 970 und der Geforce GTX 980.

Beide Karten sollen 2 MByte L2-Cache bieten, je 512 KByte sind einem 64-Bit-Controller vorgelagert, also vermutlich 256 KByte pro GDDR5-Speicherbaustein. Während Programme 2 MByte bei der GTX 980 auslesen, sind es bei der GTX 970 in den uns bekannten OpenCL- und Cuda-Anwendungen nur 1.792 KByte.

Einer der acht 512-MByte-Speicherbausteine würde damit keinen L2-Cache besitzen, der die Zugriffe auf den GDDR5 abfedert - was die Ursache für die Ruckler und die geringen Bildraten sein könnte. Einige Nutzer spekulieren gar, es sei eine 32-Bit-Partition deaktiviert, was ein 224-Bit-Interface ergebe und durch Messungen der Datentransferrate belegt sei.

Nvidia hat den Videospeicher der Geforce GTX 970 nach eigener Aussage in einen 3,5- und einen 0,5-GByte-Block unterteilt. Der Treiber versucht, möglichst nicht die 512-MByte-Partition zu füllen, eventuell weil er so programmiert ist, diesen Block mangels L2-Cache oder aufgrund der wie auch immer beschnittenen Crossbar nur im Notfall anzusprechen.

Nvidias Benchmarks zufolge ist der Leistungseinbruch bei einer Geforce GTX 980 und einer GTX 970 nahezu identisch, wenn über 3,5 GByte Videospeicher belegt sind. Gerade eine unregelmäßige Frametime äußert sich aber nicht in einer niedrigeren durchschnittlichen Bildrate, sondern vor allem in dem von vielen Nutzern beschriebenen Ruckeln.

Sollte der L2-Cache der GTX 970 beschnitten sein, sind effektiv nur 3,5 GByte nutzbar, obwohl die Karte mit 4 GByte Videospeicher beworben wird. Wir werden versuchen, das Problem in den kommenden Tagen einzugrenzen.

Nachtrag vom 26. Januar 2015, 20:02 Uhr

Nvidia hat die bisherigen Spezifikationen der Geforce GTX 970 für falsch erklärt und Monate nach der Veröffentlichung korrigiert. Es soll eine Fehlkommunikation zwischen den Ingenieuren und der technischen Presseabteilung gegeben haben, erklärte Nvidias Chef-Architekt für die Maxwell-Grafikkarten-Modelle, Jonah Alben.

Wie von Golem.de richtig vermutet, hat Nvidia bei der Geforce GTX 970 den L2-Cache eines GDDR5-Controllers deaktiviert, also ein Achtel des schnellen Zwischenpuffers. Statt 2.048 stehen der Grafikkarte nur 1.792 KByte zur Verfügung. Somit müssen sich zwei 32-Bit-Controller eine 256-KByte-L2-Partition teilen, was die Geschwindigkeit teils deutlich reduziert.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)

Obendrein sind zwei der 16 ROP-Partitionen abgeschaltet, statt 64 sind somit 56 Raster-Endstufen vorhanden. In der Praxis wird deren Durchsatz aber von 13 statt 16 Shader-Blöcke limitiert, die effektive Pixelfüllrate entspricht wie von uns dargelegt, nur 52 ROPs.

Unterm Strich bedeutet dies Folgendes: Werden die erste 3.584 MByte Videospeicher angesprochen, geschieht dies mit 196 GByte pro Sekunde. Der 512-MByte-Block ohne L2-Cache hingegen liefert zusätzliche 28 GByte pro Sekunde, was laut Nvidia im einstelligen Prozentbereich bremst und uns an die Geforce GTX 660 Ti erinnert. Die Geforce GTX 980 hingegen kann immer auf 224 GByte pro Sekunde zurückgreifen.

Geforce GTX 980Geforce GTX 970 (bisher)Geforce GTX 970 (neu)
GPCs444
SMMs161313
ALUs2.0481.6641.664
TMUs128104104
ROPs646456
L2-Cache2.048 KByte2.048 KByte1.792 KByte
Speicherinterface256 Bit256 Bit224 + 32 Bit
Speichertakt3,5 GHz GDDR53,5 GHz GDDR53,5 GHz GDDR5
Speichermenge4.096 MByte4.096 MByte3.584 + 512 MByte
Datentransfer-Rate224 GByte/s224 GByte/s196 + 28 GByte/s
Korrigierte Spezifikationen der Geforce GTX 970

eye home zur Startseite
Anonymer Nutzer 03. Feb 2015

Das Problem scheint weit schlimmer zu sein: Siehe http://bit.ly/1ECAXJd "Bris Vorontsov...

a user 29. Jan 2015

nein sind sie eben nicht! das einzige was meistens minimal ist, ist die änderung an der...

Clown 28. Jan 2015

Nö, auch dann nicht. Außer, Du bist bei AMD angestellt und sogar für PR zuständig...

neocron 28. Jan 2015

nur einen dvi 1.3 haben die dinger nicht ... und demnach muessen die 5k umstaendlicher...

neocron 28. Jan 2015

das bezweifle ich mal ganz stark :D ich bezweifle, dass du eine andere Kaufentscheidung...



Anzeige

Stellenmarkt
  1. Daimler AG, Sindelfingen
  2. Robert Bosch GmbH, Stuttgart-Vaihingen
  3. byon gmbh, Frankfurt am Main
  4. DewertOkin GmbH, Hamburg


Anzeige
Spiele-Angebote
  1. (-20%) 35,99€
  2. 16,99€

Folgen Sie uns
       


  1. Elektrorennwagen

    VW will elektrisch auf den Pikes Peak

  2. Messung

    Über 23.000 Funklöcher in Brandenburg

  3. Star Wars Battlefront 2 Angespielt

    Sternenkrieger-Kampagne rund um den Todesstern

  4. Nach Wahlniederlage

    Netzpolitiker Klingbeil soll SPD-Generalsekrektär werden

  5. Adasky

    Autonome Autos sollen im Infrarot-Bereich sehen

  6. Münsterland

    Deutsche Glasfaser baut weiter in Nordrhein-Westfalen aus

  7. Infineon

    BSI zertifiziert unsichere Verschlüsselung

  8. R-PHY- und R-MACPHY

    Kabelnetzbetreiber müssen sich nicht mehr festlegen

  9. ePrivacy-Verordnung

    Ausschuss votiert für Tracking-Schutz und Verschlüsselung

  10. Lifetab X10605 und X10607

    LTE-Tablets direkt bei Medion bestellen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
APFS in High Sierra 10.13 im Test: Apple hat die MacOS-Dateisystem-Werkzeuge vergessen
APFS in High Sierra 10.13 im Test
Apple hat die MacOS-Dateisystem-Werkzeuge vergessen
  1. MacOS 10.13 Apple gibt High Sierra frei
  2. MacOS 10.13 High Sierra Wer eine SSD hat, muss auf APFS umstellen

Elex im Test: Schroffe Schale und postapokalyptischer Kern
Elex im Test
Schroffe Schale und postapokalyptischer Kern

Indiegames-Rundschau: Fantastische Fantasy und das Echo der Doppelgänger
Indiegames-Rundschau
Fantastische Fantasy und das Echo der Doppelgänger
  1. Verlag IGN übernimmt Indiegames-Anbieter Humble Bundle
  2. Indiegames-Rundschau Cyberpunk, Knetmännchen und Kampfsportkünstler
  3. Indiegames-Rundschau Fantasysport, Burgbelagerungen und ein amorpher Blob

  1. Singleplayer Teil ist ja schön und gut, aber...

    motzerator | 01:39

  2. Re: Achtung Überraschung

    Apfelbrot | 01:29

  3. Re: Divinity II is nich so toll

    HorkheimerAnders | 01:16

  4. Re: Nie wieder ein SM ohne Wasserschutz!

    plutoniumsulfat | 01:09

  5. Re: Kritische Infrastruktur gehört in staatliche...

    plutoniumsulfat | 01:08


  1. 18:37

  2. 18:18

  3. 18:03

  4. 17:50

  5. 17:35

  6. 17:20

  7. 17:05

  8. 15:42


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel