Fermi-Architektur - Grafikkarte oder Supercomputer?

Nvidia gibt die Größe des Fermi-Dies nicht offiziell an - aber die Zahl der Transistoren, die bei über 3 Milliarden liegen soll. Daraus ergibt sich eine Die-Größe von rund 500 Quadratmillimetern. Die ersten GT200 lagen bei offiziell 576 Quadratmillimetern, AMDs "Cypress"-GPU der Radeon 5870 liegt bei 334 Quadratmillimetern und 2,15 Milliarden Transistoren, ebenfalls im 40-Nanometer-Prozess.

Stellenmarkt
  1. Corporate Datenschutz-Manager (m/w/d)
    Dürr AG, Bietigheim-Bissingen
  2. Software Entwickler (m/w/d) embedded Systems für Elektromobilität
    KOSTAL Automobil Elektrik GmbH & Co. KG, Dortmund
Detailsuche

Dass sich Nvidia für ein so großes Die mit den daraus resultierenden Problemen bei der Herstellung entschieden hat, liegt auch daran, dass Fermi nicht nur für Grafikkarten, sondern auch GPGPU-Anwendungen dienen soll. Schon zur Ankündigung von Fermi hatte Golem.de die Architektur beschrieben, Mitte Januar 2010 verriet Nvidia dann weitere Details.

In der Zusammenfassung ist Fermi ein sehr flexibles Design mit zahlreichen Zwischenspeichern. Die bei Grafikkarten meistbeachteten, früher "Shader-Einheiten" genannten Rechenwerke sind kleine Gleitkommaprozessoren, die nicht mit vollwertigen CPUs vergleichbar sind. 512 gibt es bei einem voll ausgebauten Fermi.

  • AMD vs. Nvidia - jetzt mit DirectX-11
  • 4xAF, 8xAF
  • 4xAF, 8xAF
  • 4xAF, 8xAF
  • 3DMark Vantage "Extreme"
  • 3DMark Vantage "Performance"
  • 1.920 x 1.200, 4xAF, 8xAF
  • 1.920 x 1.200, 4xAF, 8xAF
  • 4xAF, 8xAF
  • 1.920 x 1.200, 4xAF, 0xAF
  • 1.920 x 1.200, 4xAF, 0xAF
  • Leistungsaufnahme Gesamtsystem
  • Leistungsaufnahme Gesamtsystem
  • Leistungsaufnahme Gesamtsystem
  • 1.920 x 1.200, 4xAF, 8xAF
  • 3DMark Vantage
  • Die erste Folie der europäischen Vorstellung der GTX 480
  • Fermi-Die und Auswirkungen
  • Nvidias Benchmarks
  • Nvidias Benchmarks
  • Blockdiagramm des Fermi
  • GTX 480 SM Architektur
  • GTX 480 Physx Leistung
  • Daten der GTX 480
  • Daten der GTX 470
  • Nvidias Benchmarks
  • GTX 480 und GTX 285
  • Nvidias Preisempfehlung für die GTX 480
  • Nvidias Preisempfehlung für die GTX 470
  • Der neue King of the Hill?
  • AMD verkleidet die Rückseite.
  • Offene Heatpipes und interner Luftauslass
  • Etwas kürzer als die 5870
  • Der neue King of the Hill?
  • Stromzufuhr für 250 Watt oder mehr
  • 23 Minuten AVCHD nach WMV 720p
  • Nvidias Tests zur Rechenleistung pro Watt
  • Ein Zusatzlüfter reduziert den Lärm erheblich.
  • Das Die des Fermi
  • Die GTX 470 mit voll gekapseltem Kühler
Blockdiagramm des Fermi

Um CPU-ähnliche Aufgaben übernehmen zu können, müssen diese Minikerne zusammenarbeiten. 32 der CUDA-Cores bilden einen "Streaming Multiprocessor" (SM), von denen es dann 16 gibt. Jeder SM besitzt vier Texturierungseinheiten und laut Nvidia eine Tessellation-Engine. Unbestätigten Angaben zufolge sind aber auch diese Tessellatoren aus einer unbekannten Anzahl von CUDA-Kernen geformt.

Golem Karrierewelt
  1. IPv6 Grundlagen: virtueller Zwei-Tage-Workshop
    19./20.12.2022, virtuell
  2. AZ-500 Microsoft Azure Security Technologies (AZ-500T00): virtueller Vier-Tage-Workshop
    30.01.-02.02.2023, virtuell
Weitere IT-Trainings

Jede der 16 SMs besitzt einen 64 KByte großen Cache, der dem L1-Cache einer CPU ähnelt. Der L2-Cache, den sich alle SMs teilen müssen, ist 768 KByte groß und in der Mitte des Dies angeordnet. Somit ergeben sich insgesamt 1.792 KByte Cache - sehr viel für eine GPU. Speicherbandbreite war bei der Entwicklung auch bei der Kommunikation mit dem Grafikspeicher ein wichtiges Kriterium: Während AMD bei der Serie Radeon 5800 auf 256 Datenleitungen setzt, ist der Speicherbus bei Fermi insgesamt 384 Bit breit, verteilt auf sechs Speichercontroller. Mit schnellerem Speicher wird auch Antialiasing einfacher, es lässt sich nun auf bis zu 32x einstellen, was wir in diesem Test aber nicht berücksichtigt haben.

Einzelner SM und Funktionen
Einzelner SM und Funktionen
Das gesamte Design erscheint damit als vielfältig konfigurierbarer Prozessor, der nicht primär auf Grafik ausgelegt ist. Gerüchten zufolge soll für die nächste Geforce-Generation auch ein anderes Konzept vorgesehen gewesen sein, und der nur für Rechenanwendungen entwickelte Fermi wurde kurzfristig zum Grafikprozessor umdeklariert.

Wo sich die bei der GPU GF100 fehlenden 32 Rechenwerke des Fermi verstecken, hat Nvidia im Übrigen nicht erklärt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 480 statt 512 RechenwerkeKonstruktion mit offenen Heatpipes 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14. 13
  15.  


Besserwisser01 15. Okt 2010

früher waren es Pferdestärken vor der Kutsche dann PS bei den Autos heute sinds FPS bei...

Satan 01. Jun 2010

Für meine GeForce 9800GT Green wird ein 400W-Netzteil gefordert - meins kann zwar nur...

debris 14. Mai 2010

Die Oberfläche eines zu Staub zerbröselnden Objekts ist sicher noch deutlich größer. Ich...

Tristan23 31. Mär 2010

Die Fermi meinte ich auch nicht mit "Gammelfleisch". Das ist durchaus ein neues Design...



Aktuell auf der Startseite von Golem.de
Bundesarbeitsgericht
Arbeitgeber müssen Arbeitszeiten zwingend erfassen

Das vollständige Urteil des BAG zur Arbeitszeiterfassung liegt nun vor. Diese muss zwingend erfolgen, aber nicht unbedingt elektronisch.

Bundesarbeitsgericht: Arbeitgeber müssen Arbeitszeiten zwingend erfassen
Artikel
  1. Cyberkriminalität: Jeder vierte Jugendliche ist ein Internettroll
    Cyberkriminalität
    Jeder vierte Jugendliche ist ein Internettroll

    Einer Umfrage zufolge ist bedenkliches bis illegales Verhalten von Jugendlichen im Internet zur Normalität geworden. In Deutschland ist der Anteil sehr hoch.

  2. I am Jesus Christ angespielt: Der Jesus-Simulator lässt uns vom Glauben abfallen
    I am Jesus Christ angespielt
    Der Jesus-Simulator lässt uns vom Glauben abfallen

    Kein Scherz, keine geplante Gotteslästerung: In I am Jesus Christ treten wir als Heiland an. Golem.de hat den kostenlosen Prolog ausprobiert.
    Von Peter Steinlechner

  3. ChatGPT: Der geniale Bösewicht-Chatbot mit Stackoverflow-Bann
    ChatGPT
    Der geniale Bösewicht-Chatbot mit Stackoverflow-Bann

    ChatGPT scheint zu gut, um wahr zu sein. Der Chatbot wird von Nutzern an die (legalen) Grenzen getrieben.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • NBB: Samsung Odyssey G5 WQHD/165 Hz 203,89€ u. Odyssey G9 49"/DQHD/240Hz 849,90€ • ViewSonic VX3258 WQHD/144 Hz 229,90€ • Elgato Cam Link Pro 146,89€ • Mindstar: Alphacool Eiswolf 2 AiO 360 199€ • Alternate: Tt eSPORTS Ventus X Plus 31,98€ • 4x Philips Hue White Ambiance 49,99€ [Werbung]
    •  /