4,3 Milliarden Transistoren, auch für bessere Tessellation
Die Tessellation für die selbstständige Unterteilung von Polygonen durch die GPU war bisher eine Domäne von Nvidia - mit der 7970 war es höchste Zeit für AMD, hier aufzuholen. Daher wurden die Tessellatoren neu konstruiert, wie bisher gibt es zwei davon. Sie sitzen nun aber an einer günstigeren Position.
Über einen weiteren Cache, den AMD bisher nicht näher beschrieben hat und nur "Global Data Share" nennt, sind die Tessellatoren in der Geometrieeinheit jeder Hälfte des Tahiti-Dies mit den CUs verbunden. Logisch gesehen befinden sich die Tessellatoren zwischen den Einheiten für die Vertices und die der Geometrie. Sie können somit auf Oberflächen direkt zugreifen, ohne zeitraubende Speicherzugriffe veranlassen zu müssen.
Das soll zu viermal höherer Tessellationsleistung als bei einer 6970 führen - die gab bekanntlich schon ab einem Tessellationsfaktor von etwa 8 deutlich in der Leistung nach. Bis Faktor 13 steigt die Performance bei der 7970 laut AMD noch an, danach flacht die Kurve ab. Messbar ist das auch schon, wie auch unsere Benchmarks zeigen. Bei Anwendungen wie dem Benchmark Heaven oder Spielen wie Crysis 2 kann die 7970 nun eine GTX 580 überholen.
Während die Tessellatoren vor allem Spielen zugutekommen, sind andere Neuerungen von GCN stark auf GPU-Computing ausgelegt. Dazu zählt die Unterstützung von ECC-Speicher - den die 7970 aber noch nicht mitbringt. Aber die Speicherbandbreite ist schon recht hoch: Als erste Single-GPU-Karte im Referenzdesign bringt das AMD-Board 3 GByte GDDR5-Speicher mit, der über einen insgesamt 384 Bit breiten Bus angebunden ist. Das ergibt eine theoretische Bandbreite von 264 GByte/s. Der große und schnelle Speicher sorgt auch dafür, dass Filterfunktionen bei sehr hohen Auflösungen noch schnell arbeiten können.
Dennoch: AMD wird sich ärgern, dass man nicht mit 1 Teraflops bei doppelter Genauigkeit für Rechenanwendungen werben kann. 947 Gigaflops sind es aber geworden, und das bei Unterstützung von OpenCL 1.2, Directcompute 11.1 und AMDs eigenem AMP, das per C++ programmiert werden kann.
Ob das aber noch reicht, um sich gegen Nvidias Cuda - das gerade etwas geöffnet wurde - auch durchsetzen zu können, ist noch nicht abzusehen. Immerhin ist es nun theoretisch möglich, mit den vielen Cuda-Werkzeugen auch AMD-GPUs zu programmieren. Angesichts der flexiblen GCN-Architektur erscheint das attraktiv.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Graphics Core Next - flexibler und mit großen Caches | Neues Kühlsystem |
Ich hab' wirklich alles gelesen. Und ich muss sagen, du hast recht. Man verschwendet...
Soviel wie ein einfacher Staubsauger auf niedrigster Stufe. ;)
Wenn "er" eine "sie" ist will sie damit nichts kompensieren sondern ausfüllen.
Das gibts doch schon lange. Bei besseren (d.h. etwas teurer als Consumer aber bezahlbar...