Abo
  • Services:
Anzeige

Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne

Neben den SMs, die frei programmierbar sind, gibt es auch noch vier Funktionseinheiten mit fest verdrahteten Funktionen, in den Diagrammen sind sie als "SFU" bezeichnet. Nvidia nennt hier Sinus, Cosinus, Kehrwert und Quadratwurzel, es soll aber noch weitere geben. Da der Chiphersteller bisher keinerlei für DirectX-11 nötige Funktionen wie die Tesselation beschreibt, ist nur zu vermuten, dass die SFUs auch dafür eingesetzt werden können.

Jeder SMs steht ein "Shared Memory" von 64 KByte zur Verfügung, insgesamt also 1 MByte. Dieser Speicher, vermutlich als SRAM ausgeführt, kann auch als L1-Cache für die SMs verwendet werden, und zwar je 48 oder 16 KByte groß. Der Rest des gemeinsam genutzten Speichers dient, ähnlich einem L3-Cache in einer modernen CPU, zur Kommunikation der Kerne untereinander. Wie bei einem Crossbar sitzt das Shared Memory in der Mitte des Chips.

Blockdiagramm Fermi, in der Mitte das Shared Memory
Blockdiagramm Fermi, in der Mitte das Shared Memory
Nvidia will mit dieser Architektur zeitraubende Speicherzugriffe vermeiden, obwohl das Speichersystem ebenfalls kräftig aufgebohrt wurde. Sechs Speicherkanäle mit je 64 Bit stehen zur Verfügung, die Speichercontroller können nun erstmals bei Nvidias Desktop-GPUs GDDR5 adressieren. Die maximale Speichermenge beträgt 6 GByte, wovon vor allem Rechenanwendungen profitieren - für Spiele sind solche Speichermengen bei heute maximal 2.560 x 1.600 Pixeln auf einem Monitor auch mit aufwendigen Filterfunktionen noch nicht nötig. Bisher waren bei den Tesla- und Quadro-Karten 4 GByte das Maximum.

Das Speichermodell, das die GPU verwalten kann, kennt nun nicht mehr nur Unterscheidungen zwischen verschiedenen Allozierungsarten, sondern auch die Form "Global". Der gesamte Speicher kann damit Anwendungen zur Verfügung stehen, was eine Voraussetzung für Sprachen wie C++ ist.

Der Scheduler ordnet Threads neu
Der Scheduler ordnet Threads neu
Die Optimierung auf CUDA, OpenCL oder DirectX-Compute zeigt sich auch daran, dass der Speicher nun Fehlerkorrektur nach ECC beherrscht. Derartige Chips sind deutlich teurer als herkömmliches DRAM, für rund um die Uhr laufende Systeme aber ein großer Vorteil, weil sie Speicherfehler selbst erkennen und auch ohne Absturz melden können.

Ebenfalls auf Rechenanwendungen zielen zwei Bereiche der Fermi-Architektur, die sich um die Threadverwaltung kümmern. In Hardware ausgeführt ist der neue Scheduler, den Nvidia "GigaThread" nennt - den Namen hat man sich auch gleich schützen lassen. Er ist doppelt ausgeführt und verteilt die Aufgaben an die SMs.

Dabei bekommt er jedoch Hilfe von einer Software namens "Parallel Thread eXecution" oder PTX. Sie stellt eine virtuelle Maschine dar, welche die Aufgaben direkt aus der Anwendung aufteilt. PTX-Befehle sollen sich in Anwendungen direkt einbauen, aber auch über Bibliotheken aufrufen lassen. Der Treiber der GPU wickelt sie dann ab, quasi als eine Art Präprozessor.

Anzeige
 Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 KerneNvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne 

eye home zur Startseite
ossa 19. Nov 2009

Ist doch Egal selche Wersion man benutzt Linux ist auch schon seit Jahren bei 2.6 und...

Idioten 07. Okt 2009

Armes Deutschland, nach mir die Sintflut. (Ihr bezahlten Foren Spiegel/Stern/Aldi/Schwarz...

Lines 02. Okt 2009

HAHA, du hast 'n Witz erklärt!

3Dfx rulez 02. Okt 2009

Angesichts der Tatsache, dass der Chip 3 Milliarden Transistoren hat und nVidia schon mit...

irata 01. Okt 2009

Physik! Gab es ja schon bei SpaceWar! Wird mal Zeit das sich da was tut. Vielleicht kommt...



Anzeige

Stellenmarkt
  1. Robert Bosch GmbH, Abstatt
  2. serviceline PERSONAL-MANAGEMENT MÜNCHEN GMBH & CO. KG, München, Böblingen
  3. UNIQ GmbH, Holzwickede
  4. Infokom GmbH, Karlsruhe


Anzeige
Top-Angebote
  1. 129,99€ (219,98€ für zwei)
  2. 49,99€ + 5,99€ Versand (Vergleichspreis 65,87€)

Folgen Sie uns
       


  1. Facebook Messenger

    Bug lässt iPhone-Nutzer nur wenige Wörter tippen

  2. Multi-Shot-Kamera

    Hasselblad macht 400-Megapixel-Fotos mit 2,4 GByte Größe

  3. Mitsubishi

    Rückkamera identifiziert Verkehrsteilnehmer

  4. Otherside Entertainment

    Underworld Ascendant soll mehr Licht ins Dunkle bringen

  5. Meltdown und Spectre

    "Dann sind wir performancemäßig wieder am Ende der 90er"

  6. Google Play Services

    Update gegen Chromecast-WLAN-Blockade kommt bald

  7. Cars 3 und Coco in HDR

    Die ersten Pixar-Filme kommen als Ultra-HD-Blu-ray

  8. Überwachungstechnik

    EU-Parlament fordert schärfere Ausfuhrregeln

  9. Loki

    App zeigt Inhalte je nach Stimmung des Nutzers an

  10. Spielebranche

    Fox kündigt Studiokauf und Alien-MMORPG an



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Nachbarschaftsnetzwerke: Nebenan statt mittendrin
Nachbarschaftsnetzwerke
Nebenan statt mittendrin
  1. Curie Google verlegt drei neue Seekabel
  2. Nextdoor Das soziale Netzwerk für den Blockwart
  3. Hasskommentare Neuer Eco-Chef Süme will nicht mit AfD reden

Sgnl im Hands on: Sieht blöd aus, funktioniert aber
Sgnl im Hands on
Sieht blöd aus, funktioniert aber
  1. NGSFF alias M.3 Adata zeigt seine erste SSD mit breiterer Platine
  2. Displaytechnik Samsung soll faltbares Smartphone auf CES gezeigt haben
  3. Vuzix Blade im Hands on Neue Datenbrille mit einem scharfen und hellen Bild

EU-Urheberrechtsreform: Abmahnungen treffen "nur die Dummen"
EU-Urheberrechtsreform
Abmahnungen treffen "nur die Dummen"
  1. Leistungsschutzrecht EU-Kommission hält kritische Studie zurück
  2. Leistungsschutzrecht EU-Staaten uneins bei Urheberrechtsreform

  1. Re: Timing & Cache Geschichte

    JohnDoeJersey | 15:02

  2. Re: Als Kopierschutz einfach und effektiv

    Dwalinn | 15:01

  3. Geil!

    das_mav | 15:00

  4. Re: Sieht interessant aus

    Gemüseistgut | 14:58

  5. Re: Als einziger Hersteller von Smartphones hat...

    PocketIsland | 14:57


  1. 13:15

  2. 13:00

  3. 12:45

  4. 12:30

  5. 12:00

  6. 11:58

  7. 11:48

  8. 11:27


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel