Graphics Core Next - flexibler und mit großen Caches

Vor einem Jahr gab es viele hochgezogene Augenbrauen beim Blick auf AMDs GPU-Architektur VLIW4. AMD hatte im Wesentlichen sein mit der Radeon HD 5870 eingeführtes Design VLIW5 vereinfacht: Statt einer Spezialeinheit, eben der fünften, pro Block gab es nun vier, die alle Aufgaben übernehmen konnten. Das war eine Vereinfachung, die aber kaum Platz auf dem Die sparte: Statt 1.600 Rechenwerken der Radeon HD 5870 besaß die 6970 nur 1.536 der Stream-Prozessoren.

Stellenmarkt
  1. Technologiemanager (m/w/d)
    VBL. Versorgungsanstalt des Bundes und der Länder, Karlsruhe
  2. IT-Administrator (m/w/d) Bereich IT-Infrastruktur
    J. Schmalz GmbH, Glatten
Detailsuche

Mit 2.048 dieser Funktionseinheiten konnte AMD bei der 7970 deutlich zulegen, was der verringerten Strukturbreite von 28 Nanometern geschuldet ist. Dabei ist das Die der Tahiti-GPU sogar noch etwas kleiner geworden: 378 Quadratmillimeter stehen den 389 Quadratmillimetern der 6970 gegenüber.

Der Grund liegt in der neuen Architektur Graphics Core Next (GCN), die auf sehr viele völlig gleichförmig aufgebaute Rechenwerke in Form von ALUs setzt. Diese Logikeinheiten, die alleine keine komplexen Berechnungen durchführen können, sind über Caches und Spezialeinheiten vernetzt und streng hierarchisch organisiert.

  • Nur noch vier Monitorports
  • 1.920 x 1.200 Pixel, 4xAA, 8xAF
  • 3DMark11 im Performance-Preset
  • 3DMark11 im Extreme-Preset
  • 3DMark Vantage im Performance-Preset
  • 3DMark Vantage im Extreme-Preset
  •  4xAA, 8xAF
  •  4xAA, 8xAF
  •  4xAA, 8xAF
  •  4xAA, 8xAF
  • 1.920 x 1.200 Pixel, 0xAA, 4xAF
  •  4xAA, 8xAF
  •  4xAA, 8xAF
  • Gesamtsystem nach 5 Minuten
  • Gesamtsystem nach 5 Minuten
  • Gesamtsystem nach 5 Minuten
  • Alle neuen Karten mit GCN
  • Die Neuerungen im Überblick
  • Neues Kühlsystem
  •  
  •  
  • Höhere Takte und mehr Recheneinheiten
  •  
  •  
  •  
  •  
  • Ausgefeiltes Cachesystem
  • Die Struktur der Tahiti-GPU
  •  
  • Bis zu viermal schnellere Tessellation
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  • Treiberoptimierungen 2010 bis 2011
  •  
  • Der Videoencoder in der GPU
  •  
  •  
  •  
  •  
  • Neuer Kühler mit Dampfkammer aus Kupfer
  • Schnellere Tessellation bei Heaven
  •  
  •  
  • Furmark 1.80 kommt nicht über 83 Grad.
  • Keine Backplate bei der 7970 (unten) Bild: Nico Ernst / Golem.de
  • 6970 und 7970 im Vergleich - Bild: Nico Ernst / Golem.de
  • Größerer Lufteinlass bei der 7970 (links) - Bild: Nico Ernst / Golem.de
  • Nur noch ein DVI-Port - Bild: Nico Ernst / Golem.de
  • Die 7970 (vorne) ist 5 Millimeter länger - Bild: Nico Ernst / Golem.de
Die Struktur der Tahiti-GPU

Der Kern der Architektur ist eine Compute Unit (CU). Sie besteht aus 64 der ALUs und kann unabhängig vom Rest des Systems operieren. Wie eine CPU verfügt die CU dazu über Load/Store-Einheiten, einen Scheduler, eine Verzweigungseinheit und eigene Register - die fehlten bisher bei AMDs Designs. Die CU arbeitet dabei auch nicht mehr mit besonders langen Instruktionen, den VLIWs, sondern einer Vektoreinheit und einem Coprozessor.

Golem Akademie
  1. Mobile Device Management mit Microsoft Intune
    22.-23. November 2021, online
  2. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  3. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
Weitere IT-Trainings

Je vier der CUs teilen sich den Befehlscache (16 KByte) und den Datencache (32 KByte), was bei 32 CUs schon einen L1-Cache von 384 KByte ergibt. Dazu kommt noch ein L2-Cache für alle CUs von 768 KByte. Zusammen sind das 1.152 KByte an Caches. Zum Vergleich: Die erste Version von Nvidias Fermi kam bei über 500 Quadratmillimetern Die-Größe auch nur auf 1.792 KByte an Caches.

Überhaupt ähnelt GCN Fermi in der Flexibilität der CUs stark. Die Organisation der CUs ist jedoch unterschiedlich, so dass sich die Zahl der ALUs nicht vergleichen lässt. 512 sind es bei Fermi und 2.048 bei GCN. Sinnvoller ist ein Blick auf die SIMD-Einheiten selbst. Was einer CU bei GCN entspricht, ähnelt dem "Streaming Multiprocessor" (SM) bei Nvidia. 32 CUs gibt es bei AMD und 16 bei Nvidia - was nun aber auch nicht bedeutet, dass die Radeon HD 6970 doppelt so schnell wie eine GTX 580 wäre. GPUs lassen sich, ebenso wie CPUs, nicht anhand der Zahl der Rechenwerke vergleichen, weil die Architekturen so unterschiedlich sind.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Neue Architektur für drei Serien4,3 Milliarden Transistoren, auch für bessere Tessellation 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13. 12
  14. 13
  15. 14
  16.  


x3cion 29. Aug 2013

Ich hab' wirklich alles gelesen. Und ich muss sagen, du hast recht. Man verschwendet...

ozelot012 18. Jan 2012

Soviel wie ein einfacher Staubsauger auf niedrigster Stufe. ;)

Crass Spektakel 03. Jan 2012

Wenn "er" eine "sie" ist will sie damit nichts kompensieren sondern ausfüllen.

Crass Spektakel 03. Jan 2012

Das gibts doch schon lange. Bei besseren (d.h. etwas teurer als Consumer aber bezahlbar...

WinMo4tw 25. Dez 2011

Mikroruckler, Unterstützung usw sind sicherlich Gründe, dass solche Karten für die...



Aktuell auf der Startseite von Golem.de
Klimaforscher
Das Konzept der Klimaneutralität ist eine gefährliche Falle

Mit der Entnahme von CO2 in den nächsten Jahrzehnten netto auf null Emissionen zu kommen, klingt nach einer guten Idee. Ist es aber nicht, sagen Klimaforscher.
Von James Dyke, Robert Watson und Wolfgang Knorr

Klimaforscher: Das Konzept der Klimaneutralität ist eine gefährliche Falle
Artikel
  1. Beats, E-Rezept, Vivobooks: Noch mehr neue Kopfhörer von Apple geplant
    Beats, E-Rezept, Vivobooks
    Noch mehr neue Kopfhörer von Apple geplant

    Sonst noch was? Was am 19. Oktober 2021 neben den großen Meldungen sonst noch passiert ist, in aller Kürze.

  2. Kalter Krieg 2.0?: Die Aufregung um Chinas angebliche Hyperschallwaffe
    Kalter Krieg 2.0?
    Die Aufregung um Chinas angebliche Hyperschallwaffe

    Die Volksrepublik China soll eine Hyperschallwaffe getestet haben. China dementiert die Vorwürfe aber und sagt, es wäre ein Raumschiff gewesen.
    Eine Analyse von Patrick Klapetz

  3. M1 Pro/Max: Dieses Apple Silicon ist gigantisch
    M1 Pro/Max
    Dieses Apple Silicon ist gigantisch

    Egal ob AMD-, Intel- oder Nvidia-Hardware: Mit dem M1 Pro und dem M1 Max schickt sich Apple an, die versammelte Konkurrenz zu düpieren.
    Eine Analyse von Marc Sauter

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Cyber Week: Bis zu 16% auf SSDs & RAM von Adata & bis zu 30% auf Alternate • 3 Spiele für 49€: PC, PS5 uvm. • Switch OLED 369,99€ • 6 Blu-rays für 40€ • MSI 27" Curved WQHD 165Hz HDR 479€ • Chromebooks zu Bestpreisen • Alternate (u. a. Team Group PCIe-4.0-SSD 1TB 152,90€) [Werbung]
    •  /