1,4 Milliarden Transistoren pro Chip, Karten mit 236 Watt. Früher als erwartet hat Nvidia seine beiden neuen Grafikkarten "GTX-280" und "GTX-260" vorgestellt. Sie basieren auf einer neuen GPU-Architektur namens "GT-200", mit der Nvidia knapp 1 Teraflop Rechenleistung erreicht. Dafür ist jedoch das größte Die der Grafikgeschichte nötig, die Karten nehmen bis zu 236 Watt elektrischer Leistung auf.
Die GT-200-Architektur ist laut Nvidias eigenen Angaben die erste komplette Neuentwicklung seit der Serie GeForce-8 mit deren G80-Architektur . Das Ziel war eine Verdopplung der Rechenleistung von den 518 GFlop einer 8800-GTX. Diesen Wert hat Nvidia nicht ganz erreicht, 933 GFlop sind es bei der GeForce GTX-280 mit einfacher Genauigkeit. Für reine Rechenanwendungen im technisch/wissenschaftlichen Umfeld beherrscht der GT-200 nun auch das Rechnen mit 64-Bit-Werten bei doppelter Genauigkeit und kommt damit noch auf 90 GFlop.
Um diese hohen Werte zu erreichen, hat Nvidia die Zahl der Shader-Einheiten ebenfalls knapp verdoppelt, von 128 bei der 8800-GTX auf 240 bei der GTX-280. Wurden diese beim G80 noch "Stream Processors" genannt, so spricht Nvidia nun selbstbewusst von "streaming multiprocessors" oder gleich "Processor Cores", so, als ob es sich um Allzweckrechenwerke wie bei einer CPU handeln würde.
Je acht der Kerne sind in einem "Texture Processing Cluster" zusammengefasst, bei reinen Rechenanwendungen nennt Nvidia diese "Thread Processing Cluster", die Abkürzung ist in jedem Fall TPC. Die Kerne dieser Cluster teilen sich einen eigenen L1-Cache von 16 KByte.
Auf dem Die von über 500 Quadratmillimetern sind die TPCs in den vier Ecken angeordnet, dazwischen sitzen die 80 Texture Mapping Units (TMU) und 32 Raster Operating Processors (ROP). Die vier TCP-Blöcke haben jeweils von zwei Seiten auf diese Backend-Einheiten Zugriff, ebenso wie auf den lokalen Framebuffer - über dessen Größe schweigt sich Nvidia aber noch aus.
Dazu kommt noch ein nun 512 Bit breiter Port zum Speichern der Grafikkarte, beim G80 waren es noch 384 Bit, allerdings wurde der Bus schon beim G92 auf 512 Bit verbreitert. Neu ist jedoch die Speichermenge von 1 GByte bei der GTX-280 oder 896 MByte bei der GTX-260.
Wie Nvidias Chefentwickler David Kirk schon im Interview mit Golem.de erklärte, wurde das Design der GPU also noch breiter. Damit die 240 Rechenwerke noch hinreichend parallel arbeiten können, hat Nvidia noch vor den Shader-Einheiten einen in Hardware ausgeführten "Thread Scheduler" vorangestellt. Jeder der Kerne soll in Zusammenarbeit mit dem L1-Cache 1.024 Threads gleichzeitig offen halten können, für die gesamte GPU sind es dann 30.720.
Um so viel Parallelität erreichen zu können, hat Nvidia den nach Die-Fläche größten Grafikprozessor der Geschichte gebaut, was auch daran liegt, dass die GPU in 65 Nanometern bei TSMC gefertigt wird. Intels Penryn-Kerne sind schon in 45 Nanometern gefertigt, und auch AMDs Grafikprozessoren werden mit 55 Nanometern Strukturbreite hergestellt. Der GT-200 ist somit mit über 500 Quadratmillimetern fast fünfmal so groß wie ein Dual-Core-Die von Intels Penryn. Insgesamt besteht der GT-200 aus 1,4 Milliarden Transistoren. Nur maximal 82 GT-200-GPUs passen auf einen 300-Millimeter-Wafer.
Das Die dieses Grafikprozessors ist für beide aktuellen Modelle gleich groß, allein die Zahl der freigeschalteten Kerne, die Taktungen und die Menge des Speichers unterscheiden GTX-280 und GTX-260. Wie schon beim G80 startet Nvidia mit zwei High-End-Modellen, die damals aber noch GTX und GTS hießen. Ob es vor einem Wechsel auf 55 Nanometer, der für den Herbst 2008 anstehen soll, weitere GT-200-Modelle gibt, ist nicht bekannt.
Grafikkarte
GeForce GTX-280
GeForce GTX-260
Stream-Einheiten
240
192
GPU-Takt
602 MHz
576 MHz
Stream-Takt
1.296 MHz
1.242 MHz
Speichertakt
1.107 MHz
999 MHz
Speicher
1 GByte GDDR3
896 MByte GDDR3
Stromversorgung
6-pin + 8-pin
6-pin + 6-pin
Leistungsaufnahme
236 Watt
182 Watt
Äußerlich unterscheiden sich die beiden GTX-Karten kaum, augenfällig ist nur, dass die GTX-280 neben einem 6-Pin-Anschluss für PCIe-Stromversorgung auch eine 8-Pin-Buchse aufweist. Diese ist auch zwingend mit einem 8-Pin-Stecker zu belegen, da die Karte unter Last bis zu 236 Watt aufnimmt - ein neuer Minusrekord für eine Grafikkarte. Die GTX-260 kommt mit zwei 6-Pin-Buchsen aus, bei der 8800 GTS war das zum Start der G80-Architektur aber noch eine 6-Pin-Buchse. Auch die GTX-260 benötigt maximal laut Nvidia noch 182 Watt.
Da Nvidia Golem.de keine Testexemplare zur Verfügung stellen wollte, müssen wir die üblichen Benchmarks für neue GPU-Architekturen an dieser Stelle schuldig bleiben. Wir werden diese Meldung jedoch um eine Link-Liste ergänzen, sobald die Tests der üblichen Hardwarewebseiten erschienen sind.
Laut Nvidias eigenen Benchmarks - die allesamt in 2.560 x 1.536 Pixeln durchgeführt wurden - ist die GTX-280 im Schnitt 1,6-mal so schnell wie AMD Radeon HD 3870 X2. Diese benötigt dafür jedoch schon zwei Grafikprozessoren. Neben der reinen Spieleleistung hat Nvidia mit der GT-200-Architektur aber auch reine Rechenanwendungen jenseits des technisch/wissenschaftlichen Umfeldes im Auge.
Als erstes Beispiel soll demnächst das Programm "Badaboom" von Elemental Technologies erscheinen. Es kodiert 720p-Videos in iPod-Formate laut Nvidia 18-mal schneller als ein Core 2 Duo mit zwei Kernen, der allerdings für diesen Test nur mit 1,66 GHz lief. Bisher war das Programm nur als "Rapid HD" als Plug-in für Adobe Premiere Pro erhältlich.
Als weiteren Beleg für die Verlagerung von Rechenleistung aus der CPU zur GPU will Nvidia demnächst auch einen Treiber für die eigene Physik-Engine "PhysX" vorlegen. Mindestens acht neue Physx-Titel, darunter die Football-Simulation "Backbreaker", sollen noch 2008 erscheinen.
Innerhalb der kommenden Tage sollen die beiden neuen Grafikkarten im Onlinehandel zu haben sein. Setzen die US-Preise von 649 US-Dollar für die GTX-280 und 399 US-Dollar für eine neue Grafikgeneration ebenfalls neue Rekorde, so sollen die Karten in Deutschland laut Nvidias Empfehlung mit 549 beziehungsweise 309 Euro für High-End-Karten noch im üblichen Rahmen legen.