Abo
  • IT-Karriere:

GeForce 8800: DirectX 10, mehr Speicher und Strombedarf

Komplett neue GPU-Architektur

Bei der Adressierung des Speichers beginnen bereits die Neuerungen des G80-Prozessors. Hatte sich ATI bereits mit der Radeon-X1900-Generation für einen Ringbus und mit dem Radeon X1950 für GDDR-4-Speicher entschieden, so bindet Nvidia die GDDR-3-Chips noch einzeln an die GPU an. Auf Grund der Speichermenge bei den GTX- und GTS-Modellen des GeForce 8800 ergibt sich so ein Speicherbus von 384 bzw. 320 Bit. Dieser Unterschied macht sich deutlich in der jeweiligen Speicherbandbreite bemerkbar: 86,4 GByte pro Sekunde sind es beim GTX, beim GTS nur noch 64. Somit ist die günstigere Karte auf Grund des Busses - und nicht nur durch die nur wenig geringeren Taktungen - deutlich langsamer.

Stellenmarkt
  1. regiocom SE, Magdeburg
  2. Haufe Group, Freiburg

Übersicht der Shader-Modelle
Übersicht der Shader-Modelle
Wie Nvidia unumwunden zugibt, lag der Design-Schwerpunkt des G80 auf den "Unified Shadern". Sie sind zwar nicht zwingende Voraussetzungen für DirectX 10, aber - wie auch schon ATI im Gespräch mit Golem.de betonte - die einzig effiziente Lösung. Der Grund sind vor allem die sehr viel längeren Shader-Programme des "Shader Model 4.0" von DirectX 10. Sie können nun bis zu 65.535 Befehle lang sein, beim Shader Model 3.0 von DirectX 9 waren es noch 512 Instruktionen. Diese langen Code-Folgen sind bei Pixel- wie Vertex-Shadern möglich. Da zudem während des Laufs eines Shader-Programms auch Verzweigungen und Ladeoperationen möglich sind, dürfte sich der Grafik-Code moderner Spiele immer mehr dem berühmten Teller Spaghetti nähern, der in der Programmierung als Vergleich für die Schwierigkeit von Parallelisierung in Hardware gern benutzt wird: Stehen die Nudeln auf dem Tisch, scheinen sie endlos verschlungen. Ungekocht ist dasselbe Nahrungsmittel aber schön gerade und für parallele Nahrungsaufnahme ideal - aber viel zu hart.

Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Auf Grafikchips übertragen bedeutet das: Wirft man eine aufgerollte Gabel Spaghetti (-Code) in einen Grafikprozessor, so muss er das Gewirr aufdröseln. Anders als bei der Pasta ist es aber möglich, dass das eine Ende einer Shader-Nudel auf einmal warten muss, weil es mit einer anderen Teigware untrennbar verknotet ist. Die Threads behindern sich gegenseitig, was Nvidia auch in nebenstehender Grafik dargestellt hat.

Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Es gilt also, alle Nudeln möglichst einzeln zu erwischen und viel davon parallel zu verarbeiten. Dafür hat Nvidia statt der bisherigen Schlacht um immer mehr Pixel- und Vertex-Einheiten für die neue GTX 128 "Stream Processors" geschaffen, bzw. 96 der Rechenwerke beim GTS. Sie sind relativ kleine Funkionseinheiten, die aber universell für Pixel- und Vertex-Shading dienen. Dazu kommt auch noch die bei Nvidia nun ausdrücklich vorgesehene Physik-Berechnung auf der GPU - ob außer den ersten Demos mit fliegenden Haaren auch mit anderen Physik-Bibliotheken wie PhysX oder Havoc, verriet Nvidia noch nicht.

Zupf: Geometrie-Shader verzerren Modelle in der GPU
Zupf: Geometrie-Shader verzerren Modelle in der GPU
Mit DirectX 10 ziehen auch die "Geometry Shaders" in die Spiele-Programmierung ein, was bei professioneller Animation bereits üblich ist. Die GPU kann damit ohne den Hauptprozessor auch zusätzliche Dreiecke erstellen oder aus dem 3D-Model löschen. Damit kann beispielsweise eine Spielfigur - in gewissen Grenzen - ihr Aussehen ändern, was Nvidias Demos mit einem Frosch zeigen, den man kräftig an der Backe oder dem Augenlid ziehen kann. Da die Geometrie-Shader ihre Programm auch auf sich selbst anwenden können, ist zudem die Schattenberechnung einfacher: Was eine Spielfigur an Schatten werfen kann, ist der GPU ohne Hilfe von außen schon bekannt. Bisher war die Schattenberechnung - die unter anderem Doom3 zu seinem damals beeindruckenden Look verhalf - äußerst verzwickt und eine große Last für GPU wie CPU.

Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Um die 128 Stream-Prozessoren immer gut auszulasten, hat Nvidia sich eine vollmundig "GigaThread" genannte Technik ausgedacht. Ein eigener Scheduler - um im Bild zu bleiben: eine winzig kleine Gabel für nur einen Spaghetti - soll die Shader-Programme optimal auf die Rechenwerke verteilen. Wie das klappt und wie effektiv es bei den noch nicht vorhandenen DirectX-10-Spielen ist, verrät Nvidia noch nicht.

Die neue Mehrleistung durch die 128 Rechenwerke steckt Nvidia bei schon verfügbaren Spielen vorerst in höhere Frameraten bei mehr Bildqualität: 16faches Anti-Aliasing ist mit dabei, nun auch - wie bei ATIs X1900-Serie schon von Anfang an - in Verbindung mit den Überstrahl-Effekten des Rendering mit "High Dynamic Range" (HDR). Auch mit den höchsten Qualitätseinstellungen sollen die G80-Karten immer noch deutlich schneller sein als ihre Vorgänger. Vor allem für die besseren Filter hat Nvidia die Speichermenge auf den Karten erhöht.

 GeForce 8800: DirectX 10, mehr Speicher und StrombedarfGeForce 8800: DirectX 10, mehr Speicher und Strombedarf 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

ThadMiller 02. Mär 2007

ACK ACK ACK Du bringst es auf den Punkt. gruß Thad

Hearse 11. Nov 2006

Full ack

LeMurmel 11. Nov 2006

Ich weiss dass der Vergleich Core2 Duo vs. Pentium D bissl gemein ist. Aber: darum gehts...

h0 10. Nov 2006

Das Modell ist aus einem 3D-Scanner, wenn dir die Nase nicht gefällt, dann beschwerst du...

XNeo2001 10. Nov 2006

Die Überschrift der verlinkten Seite ist entlarvend ehrlich: "Reality Redefined"... Man...


Folgen Sie uns
       


Philips Hue Play HDMI Sync Box angesehen

Die Philips Hue Play HDMI Sync Box ist ein HDMI-Splitter, über den Hue Sync verwendet werden kann. Im ersten Kurztest funktioniert das neue Gerät gut.

Philips Hue Play HDMI Sync Box angesehen Video aufrufen
Ryzen 7 3800X im Test: Der schluckt zu viel
Ryzen 7 3800X im Test
"Der schluckt zu viel"

Minimal mehr Takt, vor allem aber ein höheres Power-Budget für gestiegene Frequenzen unter Last: Das war unsere Vorstellung vor dem Test des Ryzen 7 3800X. Doch die Achtkern-CPU überrascht negativ, weil AMD es beim günstigeren 3700X bereits ziemlich gut meinte.
Ein Test von Marc Sauter

  1. Agesa 1003abba Microcode-Update taktet Ryzen 3000 um 50 MHz höher
  2. Agesa 1003abb Viele ältere Platinen erhalten aktuelles UEFI für Ryzen 3000
  3. Ryzen 5 3400G und Ryzen 3 3200G im Test Picasso passt

Party like it's 1999: Die 510 letzten Tage von Sega
Party like it's 1999
Die 510 letzten Tage von Sega

Golem retro_ Am 9.9.1999 kam in den USA mit der Sega Dreamcast die letzte Spielkonsole der 90er Jahre auf den Markt. Es sollte auch die letzte Spielkonsole von Sega werden. Aber das wusste zu diesem Zeitpunkt noch niemand.
Von Martin Wolf


    TVs, Konsolen und HDMI 2.1: Wann wir mit 8K rechnen können
    TVs, Konsolen und HDMI 2.1
    Wann wir mit 8K rechnen können

    Ifa 2019 Die Ifa 2019 ist bezüglich 8K nüchtern. Wird die hohe Auflösung wie 4K fast eine Dekade lang eine Nische bleiben? Oder bringen kommende Spielekonsolen und Anschlussstandards die Auflösung schneller als gedacht?
    Eine Analyse von Oliver Nickel

    1. Kameras und Fernseher Ein 120-Zoll-TV mit 8K reicht Sharp nicht
    2. Sony ZG9 Erste 8K-Fernseher werden bald verkauft
    3. 8K Sharp schließt sich dem Micro-Four-Thirds-System an

      •  /