Test: AMDs Radeon 4850 und 4870 - Nvidia unter Druck

800 Shader-Einheiten - oder?

Dem Wettrüsten der Grafikarchitekturen kann sich auch AMD mit dem ganz auf Preis/Leistung getrimmten RV770 nicht ganz entziehen. Während Nvidia für seinen GT-200 eine theoretische Rechenleistung von 933 Gigaflops angibt, protzt AMD gleich mit 1 Teraflops beziehungsweise 1,2 Teraflops für 4850 und 4870. Beide Chiphersteller beziehen sich dabei auf Multiply-Add-Schleifen bei einfacher Genauigkeit. AMD zieht gleich noch den Vergleich mit dem ersten Teraflops-Supercomputer "ASCI Red", der 1996 fast 10.000 Pentium-Pro-CPUs brauchte - seine Teraflops aber nicht nur bei zwei Instruktionen erreichte.

Stellenmarkt
  1. Cloud Engineer / Cloud Architect mit Fokus auf Google Cloud Platform (m/f/x)
    Wabion GmbH, Stuttgart, Köln, deutschlandweit (Home-Office)
  2. Solution Architect (m/w/d) medizinische Dokumentation
    KBV Kassenärztliche Bundesvereinigung, Berlin
Detailsuche

Dennoch ist die Rechenleistung moderner GPUs beeindruckend, etwas frech ist nur, dass AMD in seinen Präsentationen vom "Terascale Computing" spricht. Erzkonkurrent Intel hatte durch seinen damaligen CTO Pat Gelsinger schon Anfang 2004 auf dem IDF die "Era of Tera" ausgerufen.

Blockdiagramm RV770
Blockdiagramm RV770
Um auf solche Zahlen zu kommen, hat AMD gegenüber den 320 Rechenwerken des R600 ganze 800 Shader-Einheiten in den RV770 gepackt. Sie heißen schon seit dem R600 auch "Stream Processing Units", im Folgenden kurz SPUs. In Nvidias GT-200 stecken "nur" 240 SPUs. AMDs Design ist jedoch grundlegend anders. Je fünf SPUs bilden eine MIMD-Einheit für "multiple instruction, multiple data". Das ergibt dann noch 160 MIMD-Kerne, die so eher mit den 240 SPUs des GT-200 vergleichbar sind. Die 800 Kerne arbeiten nur selten völlig unabhängig voneinander.

10 SIMD-Einheiten
10 SIMD-Einheiten
Weiter können aber auch noch 80 der SPUs bei AMD zu 10 SIMD-Kernen zusammengefasst werden, die also dieselben Befehle auf einen fortlaufenden Datenstrom anwenden können, "single instruction multiple data". Im MIMD-Betrieb arbeitet eine SPU der 5er-Blöcke als Akkumulator, wie in einem herkömmlichen Prozessor. Die restlichen vier Kerne rechnen und erreichen dann bei doppelter Genauigkeit laut AMD noch 240 Gigaflops.

Golem Akademie
  1. Data Engineering mit Apache Spark: virtueller Zwei-Tage-Workshop
    25.–26. April 2022, Virtuell
  2. Unity Basiswissen: virtueller Drei-Tage-Workshop
    7.–9. Februar 2022, Virtuell
Weitere IT-Trainings

Architekturvergleich R600 und RV770
Architekturvergleich R600 und RV770
Jeder der 10 SIMD-Kerne aus je 80 SPUs hat Zugriff auf eigene 16 KByte Cache, die man bei einer CPU als L1-Cache bezeichnen könnte. Dazu kommt außerhalb der Rechenwerke noch ein gemeinsamer Befehlscache von 16 KByte. Wiederum getrennt für die 10 SIMD-Blöcke gibt es einen L1-Cache für die Texturen, ebenfalls 16 KByte groß. Der L2-Cache für Texturen ist in vier 16-KByte-Blöcke geteilt, über einen Crossbar hat jede SIMD-Struktur Zugriff auf den gesamten L2-Cache und mithin 64 KByte. Erst danach sind die vier Speichercontroller zu finden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Test: AMDs Radeon 4850 und 4870 - Nvidia unter DruckTest: AMDs Radeon 4850 und 4870 - Nvidia unter Druck 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14.  


tha_specializt 06. Okt 2008

Grobfug, wer informiert ist gewinnt: http://techreport.com/articles.x/15293/1 --> nach...

Rassmus 27. Jul 2008

*fap*fap*fap*

Leser 28. Jun 2008

Wahlweise AMD oder Intel ;)

/dev/null 27. Jun 2008

Richtig! Nvidia deaktiviert in neuen Treibern sogar manche Funktionen, um alte Karten...

fettfleisch 26. Jun 2008

Stimmt das? Das waere echt krass! (obwohl einfaches Malnehmen wohl nicht ganz korrekt...



Aktuell auf der Startseite von Golem.de
Lego Star Wars UCS AT-AT aufgebaut
"Das ist kein Mond, das ist ein Lego-Modell"

Ganz wie der Imperator es wünscht: Der Lego UCS AT-AT ist riesig und imposant - und eines der besten Star-Wars-Modelle aus Klemmbausteinen.
Ein Praxistest von Oliver Nickel

Lego Star Wars UCS AT-AT aufgebaut: Das ist kein Mond, das ist ein Lego-Modell
Artikel
  1. Kryptowährung im Fall: Bitcoin legt rasante Talfahrt hin
    Kryptowährung im Fall
    Bitcoin legt rasante Talfahrt hin

    Am Samstag setzte sich der Absturz des Bitcoin fort. Ein Bitcoin ist nur noch 34.200 US-Dollar wert. Auch andere Kryptowährungen machen Verluste.

  2. eStream: Airstream-Wohnwagen mit eigenem Elektroantrieb
    eStream
    Airstream-Wohnwagen mit eigenem Elektroantrieb

    Der Wohnwagen Airstream eStream besitzt einen eigenen Elektroantrieb nebst Akku. Das entlastet das Zugfahrzeug und eröffnet weitere Möglichkeiten.

  3. Andromeda: Dieses Microsoft-Smartphone-Betriebssystem erschien nie
    Andromeda
    Dieses Microsoft-Smartphone-Betriebssystem erschien nie

    Erstmals ist ein Blick auf Andromeda möglich - das Smartphone-Betriebssystem, das Microsoft bereits vor einigen Jahren eingestellt hat.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Corsair Vengeance RGB RT 16-GB-Kit DDR4-4000 120,95€ • Alternate (u.a. AKRacing Master Pro Deluxe 449,98€) • Seagate FireCuda 530 1 TB (PS5) 189,90€ • RTX 3070 989€ • The A500 Mini 189,90€ • Intel Core i9 3.7 459,50€ • RX 6700 12GB 869€ • MindStar (u.a. 1TB SSD 69€) [Werbung]
    •  /