Nvidia nennt erste Leistungswerte zu Fermi

Nvidia hat sein neues GPU-Design Fermi , das bisher nur angekündigt ist, nicht nur für Spielegrafikkarten entwickelt, sondern mit zahlreichen Funktionen für Rechenanwendungen ausgestattet. Dass dieser Bereich für GPUs zunehmend wichtiger wird, zeigt der chinesische Rechner "Tianhe", der sich in der aktuellen Liste der schnellsten Supercomputer aus dem Stand auf Platz fünf platzieren konnte. In dieser Maschine rechnen neben 6.144 Xeons auch 5.120 AMD-GPUs.
Fermi soll in diesem Markt nicht nur durch eine gegenüber der GT200b-Architektur drastisch gesteigerte Rechenleistung punkten, sondern auch durch mehr Speicher, der auch mit Fehlerkorrektur nach ECC betrieben werden kann. Wie schnell Fermi wirklich ist, hat Nvidia bisher nur angedeutet.
Nvidia hat die bei doppelter Genauigkeit so stark gesteigerte Leistung unter anderem durch mehr Caches in der GPU erreicht, wovon bei Spielen nur Shaderprogramme, nicht aber der Großteil der Geometrie-Pipeline profitieren kann. Bei Vorstellung der Fermi-Architektur schätzte Golem.de eine Leistung von 4 Teraflops bei einfacher Genauigkeit, was bisher noch gut mit den Angaben von Nvidia korreliert. Zum Vergleich: AMD gibt für seine 5870 bei einfacher Genauigkeit 2,71 Teraflops an und 544 Gigaflops bei doppelter Genauigkeit.
Zudem hat Nvidia den Speicher bei den neuen Tesla-Karten wieder erweitert. Statt bisher maximal 4 GByte dürfen es bei der zweiten Tesla, der C2070, schon 6 GByte sein, die 2050 muss mit 3 GByte auskommen. Sie soll auch zuerst auf den Markt kommen, allerdings erst im zweiten Quartal des Jahres 2010 für rund 2.500 US-Dollar, die 2070 dann im dritten Quartal 2010 für rund 4.000 US-Dollar. Auch bei den anderen Nvidia-Produkten für den professionellen Bereich kamen zuerst die Consumerprodukte mit gleicher Architektur auf den Markt.
Die Tesla- und Quadro-Karten waren in der Regel etwas geringer getaktet als die Spielekarten, so dass die Angaben zur Leistungsaufnahme für die neuen Teslas auch noch keinen direkten Schluss erlaubt. C2050 und C2070 sollen bei typischen Aufgaben um 190 Watt aufnehmen, maximal 225 Watt.
Besonders für den Einsatz in Supercomputern können die neuen GPUs auch direkt per Infiniband an den Chipsatz des Hostcomputers angebunden werden. Bisher war dafür stets noch die CPU notwendig, mit der neuen Direktverbindung sollen Latenzen vermieden werden.