Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne
Monsterchip mit starken Optimierungen für Rechenanwendungen
Nicht mehr als GT300 oder G300, sondern unter dem Codenamen "Fermi" führt Nvidia sein nächstes GPU-Design. Einen Ausblick auf die Spieleleistung gibt es noch nicht, aber Informationen zur Architektur. Geschätzt 4 Teraflops soll der Prozessor erreichen, für CUDA und andere Sprachen gibt es eine Entwicklungsumgebung.
Nvidia versteht seine aktuelle Ankündigung als "reinen Technologie Launch", einen Termin für Karten der Reihen Geforce, Quadro und Tesla gibt es noch nicht. In den vorab zur Verfügung gestellten Unterlagen ist auch von Spielen nicht die Rede, vielmehr stellt der Chiphersteller die Verbesserungen der Architektur in Bezug auf Rechenanwendungen heraus. Darauf deutet schon der neue Codename hin, der nach dem Physik-Nobelpreisträger Enrico Fermi gewählt wurde.
- Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne
- Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne
- Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne
Während AMD sich beim RV870 alias Cypress alias Radeon 5800 im Wesentlichen darauf beschränkte, alle Funktionseinheiten zu verdoppeln, hat Nvidia die Struktur seiner GPU im Vergleich zum GT200 deutlich umgestrickt.
Mehr als verdoppelt wurden die einzelnen Streamingkerne, und zwar von 240 auf 512 Einheiten. Wie bei allen modernen GPUs können sie nur selten unabhängig voneinander arbeiten, wofür sich Nvidia nun einen neuen Namen hat einfallen lassen. Für echte SIMD-Aufgaben müssen mehrere Kerne gekoppelt werden, eine solche Gruppe nennt Nvidia nun "Streaming Multiprocessor" oder SM - nicht zu verwechseln mit "Shader Model" oder anderen Aufschlüsselungen dieser Abkürzung.
32 der einzelnen Kerne bilden einen SM, womit sich 16 der SIMD-Einheiten ergeben. Beim GT200 arbeiteten noch nur acht der Cores in einem Block zusammen, was vor allem Berechnungen mit doppelter Genauigkeit bremste. In diesem Punkt will Nvidia nun die Leistung mit Fermi gegenüber dem GT200 verachtfacht haben.
Konkrete Zahlen zur erreichbaren Leistung hat Nvidia noch nicht verraten, aber einige Anwendungsbeispiele gezeigt. So soll eine Matrizenmultiplikation mit doppelter Genauigkeit viermal schneller als auf einem GT200 laufen, was überschlagsmäßig eine Rechenleistung im Bereich von 4 Teraflops und damit wiederum das Doppelte eines RV870 bedeuten würde.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Nvidias Fermi-GPU: 3 Milliarden Transistoren und 512 Kerne |
Ist doch Egal selche Wersion man benutzt Linux ist auch schon seit Jahren bei 2.6 und...
Armes Deutschland, nach mir die Sintflut. (Ihr bezahlten Foren Spiegel/Stern/Aldi/Schwarz...
HAHA, du hast 'n Witz erklärt!
Angesichts der Tatsache, dass der Chip 3 Milliarden Transistoren hat und nVidia schon mit...