Zum Hauptinhalt Zur Navigation

Geforce GTX 1080 im Detail: Nvidias erste Pascal-Grafikkarte schneidet gut ab

Die Tests zur Geforce GTX 1080 sind da: Ausgerüstet mit Pascal -Architektur und 16-nm-Technik fallen die Resultate positiv aus. In Benchmarks und bei der Effizienz überzeugt die Nvidia -Grafikkarte, zudem wurde die D3D12-Geschwindigkeit verbessert.
/ Marc Sauter
212 Kommentare News folgen (öffnet im neuen Fenster)
Geforce GTX 1080 (Bild: Techpowerup)
Geforce GTX 1080 Bild: Techpowerup

Vor anderthalb Wochen hat Nvidia die neue Geforce GTX 1080 angekündigt , heute fällt die Sperrfrist für Tests. Bisher konnte uns der Hersteller kein Muster zur Verfügung stellen, nannte aber technische Details. Für weitere Informationen und Resultate fassen wir daher die Tests der Kollegen zusammen, da deren Artikel teils unterschiedliche Schwerpunkte setzen.

Geforce GTX 1080 - Trailer
Geforce GTX 1080 - Trailer (00:52)

Die Basis der Geforce GTX 1080 bildet die sogenannte Pascal-Architektur, welche Nvidia bereits in Form der Rechenkarte Tesla P100 vorgestellt hatte. Die fußt auf dem riesigen GP100-Chip, die Geforce GTX 1080 hingegen verwendet den kleineren und technisch an einigen Punkten stark abweichenden GP104-Grafikchip. Der wird im 16FF+ genannten Fertigungsverfahren bei der TSMC produziert, misst 314 qmm und integriert 7,2 Milliarden Transistoren. Zum Vergleich: Der im gleichen Prozess hergestellte GP100 kommt auf 610 qmm und 15 Milliarden Transistoren, die Packdichte ist also ähnlich.

Während der GP100 mit großen Caches sowie Registern auf High Performance Computing ausgelegt ist, orientiert sich der GP104 deutlich stärker an der bisherigen Maxwell-Technik, genauer an dem GM204 der Geforce GTX 980. Zudem ist die Pascal-Architektur laut Nvidia pro Shader und pro Takt nicht schneller, der Geschwindigkeitszuwachs ist anderen Änderungen zuzuschreiben. Der Aufbau des GP104 entspricht weitestgehend dem GM204.

Der Chip besteht aus vier Graphics Processor Clustern, in denen fünf statt vier Shader-Multiprozessoren stecken. Pro SM sind wie gehabt 4 x 32 ALUs und 8 TMUs verbaut, auch die Größe der Register (64 KByte), des L1-Caches (48 KByte), des Shared-Caches (96 KByte) und des L2-Caches (2 MByte) sind identisch zum GM204. Neu sind die 20 überarbeiteten Polymorph-Engines, welche für die Geometrie und Tessellation verantwortlich sind - dazu später mehr.

Bedingt durch die fünf statt vier SMs pro GPC verfügt der GP104 der Geforce GTX 1080 über 2.560 statt 2.048 Shader-Einheiten. Damit die Rechenwerke schnell genug Daten erhalten, hat Nvidia das Speicherinterface aufgewertet: Acht Partitionen mit je 8 ROPs und einem 32-Bit-Controller entsprechen dem GM204, allerdings kann das 256-Bit-Interface mit GDDD5X -Speicher umgehen.

Boost v3, FinFET und GDDR5X

Die 8 GByte stammen von Micron und taktet im Falle der Geforce GTX 1080 mit 2,5 GHz. Das ist verglichen mit den 3,5 GHz der Geforce GTX 980 wenig - jedoch überträgt GDDR5X pro Takt doppelt so viele Daten. Im QDR- statt DDR-Mode liefert der 2,5-GHz-Speicher daher 10 statt 7 GBit pro Sekunde, was umgerechnet 320 statt 224 GByte pro Sekunde ergibt. Abseits dieser theoretischen Werte hat Nvidia zudem die bekannte verlustfreie Farbkompression verbessert, was in einer deutlich höheren Durchsatzrate in der Praxis resultieren soll.

Maxwell kann Farbwerte im Verhältnis 2:1 komprimieren, indem die Differenz eines Pixels zum nächsten gespeichert wird. Bei Pascal soll dieses Verfahren weiter optimiert worden sein, zudem wurde eine 4:1- und eine 8:1-Farbkompression entwickelt. Am Beispiel von Project Cars zeigt Nvidia, dass bei Maxwell ein Großteil der Vegetation und Teile des Fahrzeugs nicht in komprimierter Form vorliegen - bei Pascal hingegen schon. Praktisch dürfte die Geforce GTX 1080 daher an die Datentransfer-Rate einer Geforce GTX 980 Ti (336 GByte pro Sekunde) heranreichen oder diese überbieten.

Ein Blick auf die Platine der Geforce GTX 1080 zeigt, dass Nvidia die Spannungsversorgung überarbeitet hat: Fünf Phasen kümmern sich um den GP104-Chip, und eine Phase steuert den GDDDR5X-Videospeicher an. Das ist wichtig, da der neue Boost v3 und die FinFET-Fertigung drastisch höhere Frequenzen ermöglichen. Der Basistakt der Geforce GTX 1080 liegt bei satten 1.607 MHz und mit Boost theoretisch bis zu 1.886 MHz. Wie üblich sind die Frequenzen von der Kühlung und dem Power-Target abhängig, da die Karte ab 83 Grad Celsius drosselt und auf 180 Watt limitiert ist.

Den Messwerten von Computerbase(öffnet im neuen Fenster) zufolge läuft die Karte nach einer Aufwärmphase in Spielen mit durchschnittlich 1.667 MHz und damit nur ein bisschen oberhalb des Basistaktes. Mit einem Power-Target von 120 Prozent und einem Temperatur-Target von 92 Grad Celsius legt die Karte im Mittel 1.778 MHz an. Noch höhere Taktraten sind zwar mit voller Lüfterdrehgeschwindigkeit und einer Übertaktung möglich, was in über 2 GHz Boost resultiert.

Wie Tom's Hardware(öffnet im neuen Fenster) detailliert ausführt, zeigen Nvidias Änderungen an der Spannungsversorgung Wirkung: Der Hersteller gibt an, die Lastspitzen drastisch reduziert zu haben, was die Messwerte bestätigen. In Metro Last Light in 4K-UHD-Auflösung nimmt die Geforce GTX 1080 im Mittel 173 Watt auf, bei der Geforce GTX 980 sind es 180 Watt. Besagte Spikes treten bei der Geforce GTX 1080 kaum noch auf - im Bereich über 300 Watt fehlen sie nahezu vollständig, zudem sind die Lastspitzen oberhalb von 200 Watt viel seltener.

Versorgt wird die Karte mit einem 8-Pol-Anschluss, über den in der Metro-Messung 133 der spezifizierten 150 Watt aufgenommen werden. Weitere 40 Watt kommen aus dem PCIe-Slot, der auf bis zu 75 Watt ausgelegt ist. Mit Übertaktung steigt der Energiebedarf der Geforce GTX 1080 auf 206 Watt.

Noch ein paar Worte zur DHE-Kühlung: : Nvidia nutzt wie gehabt eine Vapor Chamber (Verdampfungskammer) und einen leicht modifizierten 65-mm-Radiallüfter. Die PC Games Hardware(öffnet im neuen Fenster) misst aus 50 cm Entfernung sehr leise 0,4 Sone im Leerlauf. Unter Spielelast sind es laute 3,2 bis 4,0 Sone.

Async Compute und Virtual Reality

Zu den Neuerungen der Pascal-Architektur zählen laut Nvidia eine verbesserte Implementierung von Async Compute und die sogenannte Simultaneous Multi-Projection. Bei Maxwell musste für Async Compute unter Direct3D 11 noch ein Context Switch am Ende eines Draw-Calls erfolgen, was eine zeitaufwendige Neuzuteilung von Compute oder Graphics für den jeweiligen SM erzwingt. Ein aktuelles Beispiel ist der Timewarp, mit dem bei Virtual Reality ein bereits fertiger Frame mit neuen Rotationspositionsdaten versehen wird.

Zwar soll Pascal anders als AMDs derzeitige GCN-v3-Technik einen Context Switch nicht ohne Pre-Emption erledigen können, dafür aber anders als Maxwell dynamisch zur Laufzeit auf Pixel-Level- sowie später auch auf Instruktion-Ebene. Laufende Berechnungen werden gestoppt, die bisherigen Resultate gesichert und dann die priorisierte Aufgabe eingeschoben. Zudem soll Pascal als momentan einzige Architektur auch eine Pre-Emption für Graphics- und nicht nur für Compute-Workloads beherrschen. Die Benchmarks der Computerbase(öffnet im neuen Fenster) mit dem Direct3D-12-Spiel Ashes of the Singularity untermauern Nvidias Aussage: Da Async Compute per Ini-Datei umschaltbar ist, fällt ein Vergleich theoretisch leicht. Laut Oxide Games ist die Funktion aber bei allen Nvidia-Karte selbst bei passendem Ini-Eintrag schlicht deaktiviert.

Abseits klassischer Spiele hat die Simultaneous Multi-Projection für Virtual Reality angekündigt, was eine Funktion der überarbeiteten Polymorph-Engines ist. Maxwell-Grafikkarten können bis zu neun Viewports gleichzeitig rendern, was Nvidia für Multi-Res Shading nutzt. Bei Pascal-Modellen sind es 16 Stück, zudem kann einmal gerenderte Geometrie auf zwei Ausgangspunkte auf der X-Achse skalieren, was in 32 Projektionen resultiert. Das Verfahren ist vor allem für Virtual Reality interessant, muss aber von den jeweiligen Entwicklern per SDK ins Spiel implementiert werden, damit SMP verfügbar ist.

Nvidia spricht in diesem Fall von Single Pass Stereo, also einem Rechendurchgang für beide Augen zusammen. Das spart viel Zeit bei der Erstellung der Geometrie-Daten, aber auch beim Treiber-Overhead. Als weitere Idee für Virtual Reality nennt der Hersteller eine Technik namens Lens Matched Shading: Bei einem VR-Headset muss die Darstellung gekrümmt erfolgen, um die Verzerrungen durch die Linsen wieder auszugleichen.

Während bei Multi-Res Shading die später gequetschten Außenbereiche in einer niedrigeren Auflösung gerendert werden, verwirft Lens Matched Shading von Anfang an ohnehin nicht benötigte Pixel. Der Rechenaufwand pro Frame verringert sich dadurch signifikant, hinzu kommt der Leistungszuwachs durch die Simultaneous Multi-Projection. Im Idealfall sollen beide Methoden zusammen die Geschwindigkeit von VR-Anwendungen verdoppeln.

Ebenfalls neu ist die verbesserte Codec-Unterstützung für Videos: Der NVENC des GP104-Chips kann H.265 mit 12 Bit decodieren sowie mit 10 Bit encodieren und VP9 in Hardware bei bis zu 4K-DCI bei 120 Hz decodieren. Microsofts Play Ready 3.0 , ein Hardware-DRM, wird unterstützt. Um das hochauflösende Videomaterial darzustellen, verbaut Nvidia einen HDMI-2.0b-Ausgang, zwei Displayports 1.4 und ein Dual-Link-DVI. Passend dazu kündigte Nvidia an, dass bald Spiele mit High-Dynamic-Range-Ausgabe für entsprechende Fernseher verfügbar sein sollen, etwa Lawbreakers oder Rise of the Tomb Raider per Patch.

Klar schneller als eine Titan X

Trotz vergleichsweise geringen 2.560 Shader-Einheiten, aber dank der sehr hohen Boost-Taktrate von rund 1.700 MHz unter Last schlägt die Geforce GTX 1080 sämtliche anderen Grafikkarten mit einem Chip. Im Parcours der PC Games Hardware(öffnet im neuen Fenster) etwa wird Nvidias neues Pascal-Modell mit diversen Pixelbeschleunigern verglichen, die kaum schneller sein könnten: Als Referenzkarte ist die Geforce GTX Titan X nominell die flotteste Single-GPU-Grafikkarte am Markt, bei der Geforce GTX 980 Ti Lightning von MSI handelt es sich um das schnellste Custom-Design des Ti-Modells.

In 1080p, in 1440p und 2160p erzielt die Geforce GTX 1080 leicht höhere Bildraten als die Geforce GTX Titan X und MSIs Geforce GTX 980 Ti Lightning. Einzige Ausnahmen sind Metro Last Light Redux und Wolfenstein The Old Blood, wenngleich der Vorsprung gering ist. Der Abstand der Geforce GTX 1080 zur Geforce GTX 980 beträgt rund 60 Prozent. In einigen Fällen reichen deren 4 GByte Videospeicher allerdings nicht aus, die neue 8-GByte-Karte liegt dann weiter vorn. Bei spielbaren Bildraten zeigt sich allerdings kein Vorteil verglichen mit den 6 GByte Videospeicher der Geforce GTX 980 Ti.

Über alle Werte hinweg hängt die Geforce GTX 1080 die Geforce GTX Titan X um fast ein Viertel ab, erst mit starkem Overclocking erreicht die bisher schnellste Grafikkarte die Leistung des neuen Nvidia-Modells. Das ist wiederum mit Übertaktung kaum langsamer als eine Geforce GTX Titan X mit hohen 1,5 GHz. Um in 4K-UHD durchweg flüssig spielen zu können, reicht die Geschwindigkeit bei maximalen Details zumeist aus - aufwendige Kantenglättungsmodi, etwa Multisampling oder Supersampling, sollten aber vermieden werden.

Die Geforce GTX 1080 ist ab dem 27. Mai 2016 für 790 Euro verfügbar. Im Laufe des Junis folgen die Custom-Designs von Nvidias Partnern, die günstiger ausfallen sollen - spezielle Modelle für Overclocker hingegen dürften teurer werden. Noch dazu startet mit der Geforce GTX 1070 die zweite Pascal-Karte.


Relevante Themen