GeForce 8800: DirectX 10, mehr Speicher und Strombedarf

Anzeige

Komplett neue GPU-Architektur

Bei der Adressierung des Speichers beginnen bereits die Neuerungen des G80-Prozessors. Hatte sich ATI bereits mit der Radeon-X1900-Generation für einen Ringbus und mit dem Radeon X1950 für GDDR-4-Speicher entschieden, so bindet Nvidia die GDDR-3-Chips noch einzeln an die GPU an. Auf Grund der Speichermenge bei den GTX- und GTS-Modellen des GeForce 8800 ergibt sich so ein Speicherbus von 384 bzw. 320 Bit. Dieser Unterschied macht sich deutlich in der jeweiligen Speicherbandbreite bemerkbar: 86,4 GByte pro Sekunde sind es beim GTX, beim GTS nur noch 64. Somit ist die günstigere Karte auf Grund des Busses - und nicht nur durch die nur wenig geringeren Taktungen - deutlich langsamer.

Übersicht der Shader-Modelle
Übersicht der Shader-Modelle
Wie Nvidia unumwunden zugibt, lag der Design-Schwerpunkt des G80 auf den "Unified Shadern". Sie sind zwar nicht zwingende Voraussetzungen für DirectX 10, aber - wie auch schon ATI im Gespräch mit Golem.de betonte - die einzig effiziente Lösung. Der Grund sind vor allem die sehr viel längeren Shader-Programme des "Shader Model 4.0" von DirectX 10. Sie können nun bis zu 65.535 Befehle lang sein, beim Shader Model 3.0 von DirectX 9 waren es noch 512 Instruktionen. Diese langen Code-Folgen sind bei Pixel- wie Vertex-Shadern möglich. Da zudem während des Laufs eines Shader-Programms auch Verzweigungen und Ladeoperationen möglich sind, dürfte sich der Grafik-Code moderner Spiele immer mehr dem berühmten Teller Spaghetti nähern, der in der Programmierung als Vergleich für die Schwierigkeit von Parallelisierung in Hardware gern benutzt wird: Stehen die Nudeln auf dem Tisch, scheinen sie endlos verschlungen. Ungekocht ist dasselbe Nahrungsmittel aber schön gerade und für parallele Nahrungsaufnahme ideal - aber viel zu hart.

Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Schiff wartet auf Wasser: Ungleich ausgelastete Shader
Auf Grafikchips übertragen bedeutet das: Wirft man eine aufgerollte Gabel Spaghetti (-Code) in einen Grafikprozessor, so muss er das Gewirr aufdröseln. Anders als bei der Pasta ist es aber möglich, dass das eine Ende einer Shader-Nudel auf einmal warten muss, weil es mit einer anderen Teigware untrennbar verknotet ist. Die Threads behindern sich gegenseitig, was Nvidia auch in nebenstehender Grafik dargestellt hat.

Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Nvidia-Demo 'Adrianne': Nahe am Fotorealismus
Es gilt also, alle Nudeln möglichst einzeln zu erwischen und viel davon parallel zu verarbeiten. Dafür hat Nvidia statt der bisherigen Schlacht um immer mehr Pixel- und Vertex-Einheiten für die neue GTX 128 "Stream Processors" geschaffen, bzw. 96 der Rechenwerke beim GTS. Sie sind relativ kleine Funkionseinheiten, die aber universell für Pixel- und Vertex-Shading dienen. Dazu kommt auch noch die bei Nvidia nun ausdrücklich vorgesehene Physik-Berechnung auf der GPU - ob außer den ersten Demos mit fliegenden Haaren auch mit anderen Physik-Bibliotheken wie PhysX oder Havoc, verriet Nvidia noch nicht.

Zupf: Geometrie-Shader verzerren Modelle in der GPU
Zupf: Geometrie-Shader verzerren Modelle in der GPU
Mit DirectX 10 ziehen auch die "Geometry Shaders" in die Spiele-Programmierung ein, was bei professioneller Animation bereits üblich ist. Die GPU kann damit ohne den Hauptprozessor auch zusätzliche Dreiecke erstellen oder aus dem 3D-Model löschen. Damit kann beispielsweise eine Spielfigur - in gewissen Grenzen - ihr Aussehen ändern, was Nvidias Demos mit einem Frosch zeigen, den man kräftig an der Backe oder dem Augenlid ziehen kann. Da die Geometrie-Shader ihre Programm auch auf sich selbst anwenden können, ist zudem die Schattenberechnung einfacher: Was eine Spielfigur an Schatten werfen kann, ist der GPU ohne Hilfe von außen schon bekannt. Bisher war die Schattenberechnung - die unter anderem Doom3 zu seinem damals beeindruckenden Look verhalf - äußerst verzwickt und eine große Last für GPU wie CPU.

Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Eine FPU, ein Scheduler, aber viele Stream-Einheiten
Um die 128 Stream-Prozessoren immer gut auszulasten, hat Nvidia sich eine vollmundig "GigaThread" genannte Technik ausgedacht. Ein eigener Scheduler - um im Bild zu bleiben: eine winzig kleine Gabel für nur einen Spaghetti - soll die Shader-Programme optimal auf die Rechenwerke verteilen. Wie das klappt und wie effektiv es bei den noch nicht vorhandenen DirectX-10-Spielen ist, verrät Nvidia noch nicht.

Die neue Mehrleistung durch die 128 Rechenwerke steckt Nvidia bei schon verfügbaren Spielen vorerst in höhere Frameraten bei mehr Bildqualität: 16faches Anti-Aliasing ist mit dabei, nun auch - wie bei ATIs X1900-Serie schon von Anfang an - in Verbindung mit den Überstrahl-Effekten des Rendering mit "High Dynamic Range" (HDR). Auch mit den höchsten Qualitätseinstellungen sollen die G80-Karten immer noch deutlich schneller sein als ihre Vorgänger. Vor allem für die besseren Filter hat Nvidia die Speichermenge auf den Karten erhöht.

 GeForce 8800: DirectX 10, mehr Speicher und StrombedarfGeForce 8800: DirectX 10, mehr Speicher und Strombedarf 

ThadMiller 02. Mär 2007

ACK ACK ACK Du bringst es auf den Punkt. gruß Thad

Patrik 02. Mär 2007

Ich dachte bisher immer eine Workstation und ein PC wären das selbe, nur mit anderem...

Marcian 25. Feb 2007

Heute werden immer mehr PC für CAD eingesetzt als Workstations! Und in den PC arbeiten...

ThadMiller 20. Nov 2006

Na dann sind wir Zwei uns doch einig, oder? gruß Thad

Pommbaer 20. Nov 2006

völliger blödsinn. das steigert sich hier ja.. diese karte wird von Nvidia für Spieler...

Kommentieren




Anzeige
  1. Ingenieur/in für den Bereich Softwarelogistik Automotive
    ESG Elektroniksystem- und Logistik-GmbH, München
  2. Verfahrensmanger/-in für IT-Verfahren im Bildungswesen
    Dataport, Altenholz bei Kiel oder Hamburg
  3. Software-Entwickler / Java-Architekten (m/w)
    AKDB Anstalt für kommunale Datenverarbeitung in Bayern, München, Nürnberg, Regensburg und Chemnitz
  4. Datenbank Entwickler - MS SQL (m/w)
    Zentralinstitut für die kassenärztliche Versorgung in der Bundesrepublik Deutschland, Köln

 

Detailsuche


Folgen Sie uns
       


  1. Filesharing

    Schweiz will Internetsperren auf das Urheberrecht ausweiten

  2. Oslic und Oscad

    Ratgeber für freie Lizenzen

  3. Datenschutz-Grundverordnung

    Chaos Computer Club fürchtet Datenschutzauflösung durch EU

  4. 3M

    Quantenpunkte sollen LCDs farbiger machen

  5. Solar Impulse

    Solarflugzeug fliegt nach Dallas

  6. Telekom

    Bundestagspetition gegen Drosselung gestartet

  7. Linuxtag 2013

    Univention Absolventenpreis für Stauvermeidung

  8. Smartphones

    Kritik an Samsungs "rabiater Vorherrschaft"

  9. Steve Wilhite

    Ehrung für den Erfinder des "Jif"-Formates

  10. Seagate

    4-TByte-Festplatte für DVR und Videoüberwachung



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Blackberry Z10 im Langzeittest: Tausche Android gegen Blackberry
Blackberry Z10 im Langzeittest
Tausche Android gegen Blackberry

Mit dem Z10 versucht Blackberry ein Comeback im Smartphone-Markt. Auch Android-Anwendungen lassen sich auf dem Gerät installieren. Golem.de-Autor Tobias Költzsch hat zwei Wochen lang sein Galaxy S3 gegen das Z10 getauscht und im Langzeittest überprüft, wie schwer ein Umstieg ist.

  1. Smartphones Blackberry Q5 im Juli, Blackberry 10.1 wird verteilt
  2. Mobilfunk Fast drei Viertel der Smartphones laufen mit Android
  3. Blackberry-Chef "In fünf Jahren gibt es keine Tablets mehr"

Tallinn-Manual: Regierung äußert sich zu Nato-Regeln zum Töten von Hackern
Tallinn-Manual
Regierung äußert sich zu Nato-Regeln zum Töten von Hackern

Das Tallinn-Manual der Nato, das im Cyberwar das Töten von Hackern erlaubt, beschäftigt jetzt auch die Bundesregierung. "Es obliegt nicht der Bundesregierung, eine breite gesellschaftliche Debatte über die Regeln zu führen", heißt es trocken.

  1. Cyberwar Experten halten Stuxnet-Einsatz für Gewaltanwendung
  2. Cyberwar BND errichtet Abteilung zur Abwehr von Hackerangriffen
  3. Cyber Defense Nato-Papier gibt Hacker zum Abschuss frei

Ruckus Wireless: Telefonzellen werden zu Gratis-Hotspots
Ruckus Wireless
Telefonzellen werden zu Gratis-Hotspots

Über 3.000 Telefonzellen stattet Ruckus Wireless als kostenlose WLAN-Hotspots aus. Das maximale tägliche Datenübertragungsvolumen liegt pro Nutzer bei 1 GByte.

  1. Projekt Millilink Fraunhofer-Institut überträgt 40 GBit/s über Richtfunk
  2. Metageek InSSIDer 3 mit Linkscore fürs Heim-WLAN
  3. Kabel Deutschland Kostenloses Berliner WLAN-Netz 250.000-mal genutzt

Zum Artikel