Anzeige
Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Maxwell-Grafikkarte: Nvidia korrigiert die Spezifikationen der Geforce GTX 970

Stilisierte Geforce GTX 970
Stilisierte Geforce GTX 970 (Bild: Nvidia)

Die Geforce GTX 970 spricht ihre 4 GByte ungewöhnlich an, die letzten 512 MByte sind sehr langsam. Mehrere im GM204-Chip deaktivierte Funktionseinheiten drosseln die Leistung der Maxwell-Grafikkarte, wie Nvidia unter Druck der Öffentlichkeit bekannt geben musste.

Anzeige

Nvidia hat bestätigt, dass die Geforce GTX 970 über eine andere Videospeicher-Verwaltung verfügt als die Geforce GTX 980. Dies geht jedoch nicht aus den bisher veröffentlichten Spezifikationen hervor. Auf dem Papier sollten beide Grafikkarten über ein identisches Speichersystem verfügen.

Mehrere Nutzer haben festgestellt, dass eine unregelmäßige Frametime für Ruckler verantwortlich ist, oder gar die Bildrate in Spielen einbricht, wenn zwischen 3,5 und 4 GByte des Videospeichers der Geforce GTX 970 belegt sind. Bei der GTX 980 tritt dieses Problem nicht auf, auch das hat Nvidia bestätigt.

Der Hersteller begründet die Ruckler mit der geringeren Anzahl an Shader-Blöcken und deren Anbindung an das Videospeichersystem über eine leistungsschwächere Crossbar, benennt aber keine Details. Theoretisch verfügen Geforce GTX 980 und GTX 970 beide über ein 256-Bit-Interface mit 4 GByte GDDR5-Speicher mit 3,5 GHz. Diese werden von 2 MByte L2-Cache gepuffert, dahinter sind 64 Raster-Endstufen (ROP) geschaltet.

Nun leidet die Geforce GTX 970 unter zwei Problemen: Messwerte zeigen, dass die Pixelfüllrate nicht 64, sondern 52 Raster-Endstufen entspricht. Da Nvidia angibt, die geringere Anzahl an Shader-Blöcken sei schuld, liegt die Vermutung nahe, dass bei der Maxwell-Architektur die Pixelfüllrate nicht durch die ROP-, sondern die Shader-Einheiten begrenzt wird, ähnlich wie bei Fermi.

Jedem der 16 Shader-Blöcke des Maxwell-Chips GM204 sind vier Raster-Endstufen zugeordnet, die wahrscheinlich wie bei Fermi und Kepler per 128-Bit-Bus mit den Shader-Blöcken verbunden sind. Bei nur 13 statt 16 Blöcken werden die ROPs in ihrer Leistung limitiert - die entspricht dann besagten 52 Raster-Endstufen. Die zusätzlichen 12 vorhandenen ROPs machen sich nur bemerkbar, wenn hohe Kantenglättungsmodi aktiviert sind, etwa 8x MSAA.

Die verglichen mit der Geforce GTX 980 geringere Pixelfüllrate der Geforce GTX 970 äußert sich jedoch schlicht in weniger Bildern pro Sekunde. Dies gilt vor allem bei älteren, nicht allzu Shader-lastigen Spielen oder in hohen Auflösungen wie Ultra-HD, bei Supersampling oder bei Downsampling.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)

Die reduzierte Pixelfüllrate erklärt nicht, warum die Geforce GTX 970 erst dann deutliche Ruckler zeigen soll, wenn mehr als 3,5 der 4 GByte Videospeicher verwendet werden. Auf der Grafikkarte sind acht Speicherchips verbaut, jeder davon hängt an einem 32-Bit-Interface. Zwei davon schaltet Nvidia zusammen, das macht vier 64-Bit-Controller und somit theoretisch ein 256-Bit-Speicherinterface bei der Geforce GTX 970 und der Geforce GTX 980.

Beide Karten sollen 2 MByte L2-Cache bieten, je 512 KByte sind einem 64-Bit-Controller vorgelagert, also vermutlich 256 KByte pro GDDR5-Speicherbaustein. Während Programme 2 MByte bei der GTX 980 auslesen, sind es bei der GTX 970 in den uns bekannten OpenCL- und Cuda-Anwendungen nur 1.792 KByte.

Einer der acht 512-MByte-Speicherbausteine würde damit keinen L2-Cache besitzen, der die Zugriffe auf den GDDR5 abfedert - was die Ursache für die Ruckler und die geringen Bildraten sein könnte. Einige Nutzer spekulieren gar, es sei eine 32-Bit-Partition deaktiviert, was ein 224-Bit-Interface ergebe und durch Messungen der Datentransferrate belegt sei.

Nvidia hat den Videospeicher der Geforce GTX 970 nach eigener Aussage in einen 3,5- und einen 0,5-GByte-Block unterteilt. Der Treiber versucht, möglichst nicht die 512-MByte-Partition zu füllen, eventuell weil er so programmiert ist, diesen Block mangels L2-Cache oder aufgrund der wie auch immer beschnittenen Crossbar nur im Notfall anzusprechen.

Nvidias Benchmarks zufolge ist der Leistungseinbruch bei einer Geforce GTX 980 und einer GTX 970 nahezu identisch, wenn über 3,5 GByte Videospeicher belegt sind. Gerade eine unregelmäßige Frametime äußert sich aber nicht in einer niedrigeren durchschnittlichen Bildrate, sondern vor allem in dem von vielen Nutzern beschriebenen Ruckeln.

Sollte der L2-Cache der GTX 970 beschnitten sein, sind effektiv nur 3,5 GByte nutzbar, obwohl die Karte mit 4 GByte Videospeicher beworben wird. Wir werden versuchen, das Problem in den kommenden Tagen einzugrenzen.

Nachtrag vom 26. Januar 2015, 20:02 Uhr

Nvidia hat die bisherigen Spezifikationen der Geforce GTX 970 für falsch erklärt und Monate nach der Veröffentlichung korrigiert. Es soll eine Fehlkommunikation zwischen den Ingenieuren und der technischen Presseabteilung gegeben haben, erklärte Nvidias Chef-Architekt für die Maxwell-Grafikkarten-Modelle, Jonah Alben.

Wie von Golem.de richtig vermutet, hat Nvidia bei der Geforce GTX 970 den L2-Cache eines GDDR5-Controllers deaktiviert, also ein Achtel des schnellen Zwischenpuffers. Statt 2.048 stehen der Grafikkarte nur 1.792 KByte zur Verfügung. Somit müssen sich zwei 32-Bit-Controller eine 256-KByte-L2-Partition teilen, was die Geschwindigkeit teils deutlich reduziert.

  • Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)
  • Speichersystem der Geforce GTX 970 mit teildeaktiviertem L2-Cache (Bild: Nvidia)
  • Blockdiagramm des GM204-Chips im Vollausbau (Bild: Nvidia)
Frametimes einer GTX 980 @ GTX 970 und einer echten GTX 970. Weniger Millisekunden und gleichmäßigere Zeiten sind besser! (Bild: PCGH)

Obendrein sind zwei der 16 ROP-Partitionen abgeschaltet, statt 64 sind somit 56 Raster-Endstufen vorhanden. In der Praxis wird deren Durchsatz aber von 13 statt 16 Shader-Blöcke limitiert, die effektive Pixelfüllrate entspricht wie von uns dargelegt, nur 52 ROPs.

Unterm Strich bedeutet dies Folgendes: Werden die erste 3.584 MByte Videospeicher angesprochen, geschieht dies mit 196 GByte pro Sekunde. Der 512-MByte-Block ohne L2-Cache hingegen liefert zusätzliche 28 GByte pro Sekunde, was laut Nvidia im einstelligen Prozentbereich bremst und uns an die Geforce GTX 660 Ti erinnert. Die Geforce GTX 980 hingegen kann immer auf 224 GByte pro Sekunde zurückgreifen.

Geforce GTX 980Geforce GTX 970 (bisher)Geforce GTX 970 (neu)
GPCs444
SMMs161313
ALUs2.0481.6641.664
TMUs128104104
ROPs646456
L2-Cache2.048 KByte2.048 KByte1.792 KByte
Speicherinterface256 Bit256 Bit224 + 32 Bit
Speichertakt3,5 GHz GDDR53,5 GHz GDDR53,5 GHz GDDR5
Speichermenge4.096 MByte4.096 MByte3.584 + 512 MByte
Datentransfer-Rate224 GByte/s224 GByte/s196 + 28 GByte/s
Korrigierte Spezifikationen der Geforce GTX 970

eye home zur Startseite
Anonymer Nutzer 03. Feb 2015

Das Problem scheint weit schlimmer zu sein: Siehe http://bit.ly/1ECAXJd "Bris Vorontsov...

a user 29. Jan 2015

nein sind sie eben nicht! das einzige was meistens minimal ist, ist die änderung an der...

Clown 28. Jan 2015

Nö, auch dann nicht. Außer, Du bist bei AMD angestellt und sogar für PR zuständig...

neocron 28. Jan 2015

nur einen dvi 1.3 haben die dinger nicht ... und demnach muessen die 5k umstaendlicher...

neocron 28. Jan 2015

das bezweifle ich mal ganz stark :D ich bezweifle, dass du eine andere Kaufentscheidung...

Kommentieren



Anzeige

  1. Senior Consultant SAP HCM (m/w)
    über Mentis International Human Resources GmbH, Nordbayern
  2. Consultant (m/w) Business Intelligence (Reporting)
    T-Systems on site services GmbH, Nürnberg
  3. Professional IT Consultant Automotive Marketing und Sales (m/w)
    T-Systems International GmbH, Leinfelden-Echterdingen
  4. IT-Scrum Master Payment Solutions (m/w)
    Media-Saturn IT Services GmbH, Ingolstadt

Detailsuche



Anzeige
Spiele-Angebote
  1. TIPP: Ubisoft Blockbuster Sale
    (u. a. The Division 29,97€, Far Cry Primal 29,97€, Anno 2205 24,97€, Assassin's Creed...
  2. ANNO 2070 - Königsedition [PC Download]
    15,00€
  3. VORBESTELLBAR: Gran Turismo Sport - Steel Book Edition [PlayStation 4]
    79,99€ (Vorbesteller-Preisgarantie)

Weitere Angebote


Folgen Sie uns
       


  1. Telekom-Konzernchef

    "Vectoring schafft Wettbewerb"

  2. Model S

    Teslas Autopilot verursacht Auffahrunfall

  3. Security

    Microsoft will Passwort 'Passwort' verbieten

  4. Boston Dynamics

    Google will Roboterfirma an Toyota verkaufen

  5. Oracle-Anwältin nach Niederlage

    "Google hat die GPL getötet"

  6. Selbstvermessung

    Jawbone steigt offenbar aus Fitnesstracker-Geschäft aus

  7. SpaceX

    Falcon 9 Rakete kippelt nach Landung auf Schiff

  8. Die Woche im Video

    Die Schoko-Burger-Woche bei Golem.de - mmhhhh!

  9. Zcryptor

    Neue Ransomware verbreitet sich auch über USB-Sticks

  10. LTE-Nachfolger

    Huawei schließt praktische Tests für Zukunftsmobilfunk ab



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Formel E: Monaco-Feeling beim E-Prix in Berlin-Mitte
Formel E
Monaco-Feeling beim E-Prix in Berlin-Mitte
  1. Hewlett Packard Enterprise "IT wird beim Autorennen immer wichtiger"
  2. Roborace Roboterrennwagen fahren mit Nvidia-Computer
  3. Elektromobilität BMW und Nissan wollen in die Formel E

Moto G4 Plus im Hands on: Lenovos sonderbare Entscheidung
Moto G4 Plus im Hands on
Lenovos sonderbare Entscheidung
  1. Lenovo Moto G4 kann doch mit mehr Speicher bestellt werden
  2. Android-Smartphone Lenovos neues Moto G gibt es gleich zweimal
  3. Motorola Aktionspreise für aktuelle Moto-Smartphones

Business-Notebooks im Überblick: Voll ausgestattet, dockingtauglich und trotzdem klein
Business-Notebooks im Überblick
Voll ausgestattet, dockingtauglich und trotzdem klein
  1. Elitebook 1030 G1 HPs Core-M-Notebook soll 13 Stunden durchhalten
  2. Windows 7 und 8.1 Microsoft verlängert den Skylake-Support
  3. Intel Authenticate Fingerabdruck und Bluetooth-Smartphone entsperren PC

  1. Dann werden die Bussgelder auf die Kunden umverlegt

    mrgenie | 07:00

  2. Re: Na super

    DerVorhangZuUnd... | 06:53

  3. Re: Nein.

    barforbarfoo | 06:52

  4. Verstehe nicht was so schwer daran ist

    kelzinc | 06:50

  5. Re: Gute Idee aus Verbrauchersicht

    Ovaron | 06:49


  1. 14:15

  2. 13:47

  3. 13:00

  4. 12:30

  5. 11:51

  6. 11:22

  7. 11:09

  8. 09:01


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel