GeForce 8800: DirectX 10, mehr Speicher und Strombedarf

Komplett neue GPU-Architektur

Bei der Adressierung des Speichers beginnen bereits die Neuerungen des G80-Prozessors. Hatte sich ATI bereits mit der Radeon-X1900-Generation für einen Ringbus und mit dem Radeon X1950 für GDDR-4-Speicher entschieden, so bindet Nvidia die GDDR-3-Chips noch einzeln an die GPU an. Auf Grund der Speichermenge bei den GTX- und GTS-Modellen des GeForce 8800 ergibt sich so ein Speicherbus von 384 bzw. 320 Bit. Dieser Unterschied macht sich deutlich in der jeweiligen Speicherbandbreite bemerkbar: 86,4 GByte pro Sekunde sind es beim GTX, beim GTS nur noch 64. Somit ist die günstigere Karte auf Grund des Busses - und nicht nur durch die nur wenig geringeren Taktungen - deutlich langsamer.

Stellenmarkt
  1. IT Systemadministrator (m/w/d)
    KÖNIGSTEINER AGENTUR GmbH, Stuttgart
  2. Projektmanager für Prozessoptimierung/ERP-Exper- te MS Dynamics NAV (m/w/d)
    Epple Druckfarben AG, Neusäß
Detailsuche

Übersicht der Shader-Modelle
Übersicht der Shader-Modelle
Wie Nvidia unumwunden zugibt, lag der Design-Schwerpunkt des G80 auf den "Unified Shadern". Sie sind zwar nicht zwingende Voraussetzungen für DirectX 10, aber - wie auch schon ATI im Gespräch mit Golem.de betonte - die einzig effiziente Lösung. Der Grund sind vor allem die sehr viel längeren Shader-Programme des "Shader Model 4.0" von DirectX 10. Sie können nun bis zu 65.535 Befehle lang sein, beim Shader Model 3.0 von DirectX 9 waren es noch 512 Instruktionen. Diese langen Code-Folgen sind bei Pixel- wie Vertex-Shadern möglich. Da zudem während des Laufs eines Shader-Programms auch Verzweigungen und Ladeoperationen möglich sind, dürfte sich der Grafik-Code moderner Spiele immer mehr dem berühmten Teller Spaghetti nähern, der in der Programmierung als Vergleich für die Schwierigkeit von Parallelisierung in Hardware gern benutzt wird: Stehen die Nudeln auf dem Tisch, scheinen sie endlos verschlungen. Ungekocht ist dasselbe Nahrungsmittel aber schön gerade und für parallele Nahrungsaufnahme ideal - aber viel zu hart.

Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Auf Grafikchips übertragen bedeutet das: Wirft man eine aufgerollte Gabel Spaghetti (-Code) in einen Grafikprozessor, so muss er das Gewirr aufdröseln. Anders als bei der Pasta ist es aber möglich, dass das eine Ende einer Shader-Nudel auf einmal warten muss, weil es mit einer anderen Teigware untrennbar verknotet ist. Die Threads behindern sich gegenseitig, was Nvidia auch in nebenstehender Grafik dargestellt hat.

Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Es gilt also, alle Nudeln möglichst einzeln zu erwischen und viel davon parallel zu verarbeiten. Dafür hat Nvidia statt der bisherigen Schlacht um immer mehr Pixel- und Vertex-Einheiten für die neue GTX 128 "Stream Processors" geschaffen, bzw. 96 der Rechenwerke beim GTS. Sie sind relativ kleine Funkionseinheiten, die aber universell für Pixel- und Vertex-Shading dienen. Dazu kommt auch noch die bei Nvidia nun ausdrücklich vorgesehene Physik-Berechnung auf der GPU - ob außer den ersten Demos mit fliegenden Haaren auch mit anderen Physik-Bibliotheken wie PhysX oder Havoc, verriet Nvidia noch nicht.

Zupf: Geometrie-Shader verzerren Modelle in der GPU
Zupf: Geometrie-Shader verzerren Modelle in der GPU
Mit DirectX 10 ziehen auch die "Geometry Shaders" in die Spiele-Programmierung ein, was bei professioneller Animation bereits üblich ist. Die GPU kann damit ohne den Hauptprozessor auch zusätzliche Dreiecke erstellen oder aus dem 3D-Model löschen. Damit kann beispielsweise eine Spielfigur - in gewissen Grenzen - ihr Aussehen ändern, was Nvidias Demos mit einem Frosch zeigen, den man kräftig an der Backe oder dem Augenlid ziehen kann. Da die Geometrie-Shader ihre Programm auch auf sich selbst anwenden können, ist zudem die Schattenberechnung einfacher: Was eine Spielfigur an Schatten werfen kann, ist der GPU ohne Hilfe von außen schon bekannt. Bisher war die Schattenberechnung - die unter anderem Doom3 zu seinem damals beeindruckenden Look verhalf - äußerst verzwickt und eine große Last für GPU wie CPU.

Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Um die 128 Stream-Prozessoren immer gut auszulasten, hat Nvidia sich eine vollmundig "GigaThread" genannte Technik ausgedacht. Ein eigener Scheduler - um im Bild zu bleiben: eine winzig kleine Gabel für nur einen Spaghetti - soll die Shader-Programme optimal auf die Rechenwerke verteilen. Wie das klappt und wie effektiv es bei den noch nicht vorhandenen DirectX-10-Spielen ist, verrät Nvidia noch nicht.

Die neue Mehrleistung durch die 128 Rechenwerke steckt Nvidia bei schon verfügbaren Spielen vorerst in höhere Frameraten bei mehr Bildqualität: 16faches Anti-Aliasing ist mit dabei, nun auch - wie bei ATIs X1900-Serie schon von Anfang an - in Verbindung mit den Überstrahl-Effekten des Rendering mit "High Dynamic Range" (HDR). Auch mit den höchsten Qualitätseinstellungen sollen die G80-Karten immer noch deutlich schneller sein als ihre Vorgänger. Vor allem für die besseren Filter hat Nvidia die Speichermenge auf den Karten erhöht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 GeForce 8800: DirectX 10, mehr Speicher und StrombedarfGeForce 8800: DirectX 10, mehr Speicher und Strombedarf 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


ThadMiller 02. Mär 2007

ACK ACK ACK Du bringst es auf den Punkt. gruß Thad

Hearse 11. Nov 2006

Full ack

LeMurmel 11. Nov 2006

Ich weiss dass der Vergleich Core2 Duo vs. Pentium D bissl gemein ist. Aber: darum gehts...

h0 10. Nov 2006

Das Modell ist aus einem 3D-Scanner, wenn dir die Nase nicht gefällt, dann beschwerst du...

XNeo2001 10. Nov 2006

Die Überschrift der verlinkten Seite ist entlarvend ehrlich: "Reality Redefined"... Man...



Aktuell auf der Startseite von Golem.de
Tesla Model Y im Test
Die furzende Familienkutsche

Teslas Model Y ist der Wunschtraum vieler Model-3-Besitzer. Reichweite und Raumangebot überzeugen im Test - doch der Autopilot ist nicht konkurrenzfähig.
Ein Test von Friedhelm Greis

Tesla Model Y im Test: Die furzende Familienkutsche
Artikel
  1. Games Workshop: Warhammer-40K-Modell für 30.000 Euro auf Ebay versteigert
    Games Workshop
    Warhammer-40K-Modell für 30.000 Euro auf Ebay versteigert

    Der Youtuber Squidmar hat wochenlange Arbeit in den Warhammer-40K-Thunderhawk gesteckt. Das hat sich gelohnt: Er erzielt einen Rekordpreis.

  2. USA: Programm zur Vernichtung von Huawei-Technik angelaufen
    USA
    Programm zur Vernichtung von Huawei-Technik angelaufen

    Die Mobilfunktechnik von Huawei und ZTE wird ausgebaut und entsorgt. Die Kosten für den US-Steuerzahler liegen bei 1,9 Milliarden US-Dollar.

  3. Thinkpad E14 Gen3 im Test: Ryzen-Laptop mit grandiosem Preis-Leistungs-Verhältnis
    Thinkpad E14 Gen3 im Test
    Ryzen-Laptop mit grandiosem Preis-Leistungs-Verhältnis

    Schon das Thinkpad E14 Gen2 war exzellent, bei der Gen3 aber hat Lenovo die zwei Schwachstellen - Akku und Display - behoben. Bravo!
    Ein Test von Marc Sauter

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Aktion: Win 10-Laptop oder PC kaufen, kostenloses Upgrade auf Win 11 erhalten • Bosch Professional & PC-Spiele von EA günstiger • Nur noch heute PS5-Gewinnspiel • Alternate (u. a. Asus TUF Gaming-Monitor 23,8" FHD 165Hz 179,90€) • 7 Tage Samsung-Angebote [Werbung]
    •  /