Cayman-Architektur mit 4D-Shadern
Der Aufteilung von sehr kleinen Rechenwerken, die in großer Zahl eine SIMD-Einheit bilden, ist AMD treu geblieben. 64 der winzigen ALUs bilden einen SIMD-Block. Voll funktionsfähig sind jedoch nur vier der Rechenwerke zusammen, um gemischte Befehle und Daten verarbeiten zu können. Schon seit der Radeon 4000 arbeitet AMD mit diesen MIMD-Blöcken (Multiple Instruction, Multiple Data), die dann zusammen die parallele Anwendung eines Befehls auf fortlaufenden Daten (Single Instruction, Muliple Data) ermöglichen.
Die SIMD-Verarbeitung ist der Kern der hohen Parallelität in GPUs, daher eignen sich diese Prozessoren auch zunehmend für allgemeine Rechenaufgaben. Bei Cayman hat AMD eine eingebaute Begrenzung des Konzepts aufgehoben. Beim Vorgänger Cypress (Radeon 5870) gab es für je fünf ALUs (oder einen MIMD-Block) noch eine so genannte T-Unit. Das für "transcendental" stehende T beschreibt nur, dass diese Einheit fest verdrahtet auch transzendente Funktionen wie Sinus oder Cosinus auflösen kann.
Daneben kann die T-Unit aber auch je eine Aufgabe der vier anderen Einheiten ausführen, sie lässt sich quasi zuschalten - sind aber nur transzendente Funktionen gefordert, steht die T-Unit alleine da. Das kommt mit modernem Code offenbar so häufig vor, dass eine T-Unit für vier andere ALUs wohl als Bremse gewirkt hat.
Folglich hat AMD die T-Unit gestrichen und ihre Funktionen allen ALUs spendiert. Mit weniger Chipfläche für einen gesamten Block soll sich so mehr Leistungsfähigkeit ergeben. Dennoch ist die GPU größer geworden: Cayman misst 380 Quadratmillimeter, Cypress kam noch mit 334 Quadratmillimetern aus. Die neuen ALUs und die anderen Funktionen wie die Video-Einheit UVD 3 belegen wohl mehr Platz.
Insgesamt will AMD zehn Prozent mehr Rechenleistung pro Quadratmillimeter Chipfläche erreicht haben, obwohl Cayman noch mit 40 Nanometer-Technik gefertigt wird. Beiden neuen Radeons spendiert AMD 2 GByte GDDR5-Speicher, was extremen Filterfunktionen und dem GPU-Computing zugute kommt.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Radeon HD 6950 und 6970 im Test: AMDs schnellste GPU - knapp an der Spitze vorbei | Schnellere Tesselation und GPU-Computing |
Naja. Mehr Verbrauch bedeutet auch immer mehr Wärme die aus dem Gehäuse muss. Insgesamt...
Ja. Und sie passt nicht in den ISA-Slot!!!
Es gibt immer mehrere Sichtweisen. Die einen kümmert es nur ob die eigene Karte die...
Perfekt, vielen Dank, alles was ich wissen wollte.