• IT-Karriere:
  • Services:

GeForce 8800: DirectX 10, mehr Speicher und Strombedarf

Komplett neue GPU-Architektur

Bei der Adressierung des Speichers beginnen bereits die Neuerungen des G80-Prozessors. Hatte sich ATI bereits mit der Radeon-X1900-Generation für einen Ringbus und mit dem Radeon X1950 für GDDR-4-Speicher entschieden, so bindet Nvidia die GDDR-3-Chips noch einzeln an die GPU an. Auf Grund der Speichermenge bei den GTX- und GTS-Modellen des GeForce 8800 ergibt sich so ein Speicherbus von 384 bzw. 320 Bit. Dieser Unterschied macht sich deutlich in der jeweiligen Speicherbandbreite bemerkbar: 86,4 GByte pro Sekunde sind es beim GTX, beim GTS nur noch 64. Somit ist die günstigere Karte auf Grund des Busses - und nicht nur durch die nur wenig geringeren Taktungen - deutlich langsamer.

Stellenmarkt
  1. WBS GRUPPE, deutschlandweit (Home-Office)
  2. über duerenhoff GmbH, Sulz am Neckar

Übersicht der Shader-Modelle
Übersicht der Shader-Modelle
Wie Nvidia unumwunden zugibt, lag der Design-Schwerpunkt des G80 auf den "Unified Shadern". Sie sind zwar nicht zwingende Voraussetzungen für DirectX 10, aber - wie auch schon ATI im Gespräch mit Golem.de betonte - die einzig effiziente Lösung. Der Grund sind vor allem die sehr viel längeren Shader-Programme des "Shader Model 4.0" von DirectX 10. Sie können nun bis zu 65.535 Befehle lang sein, beim Shader Model 3.0 von DirectX 9 waren es noch 512 Instruktionen. Diese langen Code-Folgen sind bei Pixel- wie Vertex-Shadern möglich. Da zudem während des Laufs eines Shader-Programms auch Verzweigungen und Ladeoperationen möglich sind, dürfte sich der Grafik-Code moderner Spiele immer mehr dem berühmten Teller Spaghetti nähern, der in der Programmierung als Vergleich für die Schwierigkeit von Parallelisierung in Hardware gern benutzt wird: Stehen die Nudeln auf dem Tisch, scheinen sie endlos verschlungen. Ungekocht ist dasselbe Nahrungsmittel aber schön gerade und für parallele Nahrungsaufnahme ideal - aber viel zu hart.

Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Auf Grafikchips übertragen bedeutet das: Wirft man eine aufgerollte Gabel Spaghetti (-Code) in einen Grafikprozessor, so muss er das Gewirr aufdröseln. Anders als bei der Pasta ist es aber möglich, dass das eine Ende einer Shader-Nudel auf einmal warten muss, weil es mit einer anderen Teigware untrennbar verknotet ist. Die Threads behindern sich gegenseitig, was Nvidia auch in nebenstehender Grafik dargestellt hat.

Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Es gilt also, alle Nudeln möglichst einzeln zu erwischen und viel davon parallel zu verarbeiten. Dafür hat Nvidia statt der bisherigen Schlacht um immer mehr Pixel- und Vertex-Einheiten für die neue GTX 128 "Stream Processors" geschaffen, bzw. 96 der Rechenwerke beim GTS. Sie sind relativ kleine Funkionseinheiten, die aber universell für Pixel- und Vertex-Shading dienen. Dazu kommt auch noch die bei Nvidia nun ausdrücklich vorgesehene Physik-Berechnung auf der GPU - ob außer den ersten Demos mit fliegenden Haaren auch mit anderen Physik-Bibliotheken wie PhysX oder Havoc, verriet Nvidia noch nicht.

Zupf: Geometrie-Shader verzerren Modelle in der GPU
Zupf: Geometrie-Shader verzerren Modelle in der GPU
Mit DirectX 10 ziehen auch die "Geometry Shaders" in die Spiele-Programmierung ein, was bei professioneller Animation bereits üblich ist. Die GPU kann damit ohne den Hauptprozessor auch zusätzliche Dreiecke erstellen oder aus dem 3D-Model löschen. Damit kann beispielsweise eine Spielfigur - in gewissen Grenzen - ihr Aussehen ändern, was Nvidias Demos mit einem Frosch zeigen, den man kräftig an der Backe oder dem Augenlid ziehen kann. Da die Geometrie-Shader ihre Programm auch auf sich selbst anwenden können, ist zudem die Schattenberechnung einfacher: Was eine Spielfigur an Schatten werfen kann, ist der GPU ohne Hilfe von außen schon bekannt. Bisher war die Schattenberechnung - die unter anderem Doom3 zu seinem damals beeindruckenden Look verhalf - äußerst verzwickt und eine große Last für GPU wie CPU.

Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Um die 128 Stream-Prozessoren immer gut auszulasten, hat Nvidia sich eine vollmundig "GigaThread" genannte Technik ausgedacht. Ein eigener Scheduler - um im Bild zu bleiben: eine winzig kleine Gabel für nur einen Spaghetti - soll die Shader-Programme optimal auf die Rechenwerke verteilen. Wie das klappt und wie effektiv es bei den noch nicht vorhandenen DirectX-10-Spielen ist, verrät Nvidia noch nicht.

Die neue Mehrleistung durch die 128 Rechenwerke steckt Nvidia bei schon verfügbaren Spielen vorerst in höhere Frameraten bei mehr Bildqualität: 16faches Anti-Aliasing ist mit dabei, nun auch - wie bei ATIs X1900-Serie schon von Anfang an - in Verbindung mit den Überstrahl-Effekten des Rendering mit "High Dynamic Range" (HDR). Auch mit den höchsten Qualitätseinstellungen sollen die G80-Karten immer noch deutlich schneller sein als ihre Vorgänger. Vor allem für die besseren Filter hat Nvidia die Speichermenge auf den Karten erhöht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 GeForce 8800: DirectX 10, mehr Speicher und StrombedarfGeForce 8800: DirectX 10, mehr Speicher und Strombedarf 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Anzeige
Top-Angebote
  1. (heute Logitech MK545 Advanced Tastatur-Maus Set für 44€ statt 61,99€ im Vergleich)
  2. 111€ + Versand
  3. 111€
  4. (zu jedem Artikel aus der Aktion gibt es einen weiteren geschenkt)

ThadMiller 02. Mär 2007

ACK ACK ACK Du bringst es auf den Punkt. gruß Thad

Hearse 11. Nov 2006

Full ack

LeMurmel 11. Nov 2006

Ich weiss dass der Vergleich Core2 Duo vs. Pentium D bissl gemein ist. Aber: darum gehts...

h0 10. Nov 2006

Das Modell ist aus einem 3D-Scanner, wenn dir die Nase nicht gefällt, dann beschwerst du...

XNeo2001 10. Nov 2006

Die Überschrift der verlinkten Seite ist entlarvend ehrlich: "Reality Redefined"... Man...


Folgen Sie uns
       


Pocketalk Übersetzer - Test

Mit dem Pocketalk können wir gesprochene Sätze in eine andere Sprache übersetzen lassen. Im Test funktioniert das gut, allerdings macht Pocketalk auch nicht viel mehr als gängige und kostenlose Übersetzungs-Apps.

Pocketalk Übersetzer - Test Video aufrufen
Interview: Die Liebe für den Flight Simulator war immer da
Interview
"Die Liebe für den Flight Simulator war immer da"

Die prozedural erstellte Erde, der Quellcode vom letzten MS-Flugsimulator und eine Gemeinsamkeit mit Star Citizen: Golem.de hat mit Jörg Neumann über Technik und das Fliegen gesprochen. Neumann leitet bei Microsoft die Entwicklung des Flight Simulator.
Ein Interview von Peter Steinlechner

  1. Flug-Simulation Microsoft bereitet Alphatest des Flight Simulator vor
  2. Microsoft Neuer Flight Simulator soll Fokus auf Simulation legen

Staupilot: Der Zulassungsstau löst sich langsam auf
Staupilot
Der Zulassungsstau löst sich langsam auf

Nach jahrelangen Verhandlungen soll es demnächst internationale Zulassungskriterien für hochautomatisierte Autos geben. Bei höheren Automatisierungsgraden strebt die Bundesregierung aber einen nationalen Alleingang an.
Ein Bericht von Friedhelm Greis

  1. Autonomes Fahren Ermittler geben Testfahrerin Hauptschuld an Uber-Unfall
  2. Ermittlungsberichte Wie die Uber-Software den tödlichen Unfall begünstigte
  3. Firmentochter gegründet VW will in fünf Jahren autonom fahren

Energiewende: Grüner Wasserstoff aus der Zinnschmelze
Energiewende
Grüner Wasserstoff aus der Zinnschmelze

Wasserstoff ist wichtig für die Energiewende. Er kann als Treibstoff für Brennstoffzellenautos genutzt werden und gilt als sauber. Seine Herstellung ist es aber bislang nicht. Karlsruher Forscher haben nun ein Verfahren entwickelt, bei dem kein schädliches Kohlendioxid entsteht.
Ein Bericht von Werner Pluta

  1. Brennstoffzelle Deutschland bekommt mehr Wasserstofftankstellen
  2. Energiewende Hamburg will große Wasserstoff-Elektrolyseanlage bauen

    •  /