Abo
  • Services:

Was bei GDDR5 schiefläuft

Wer eine aktuelle Grafikkarte ohne Kühler genauer betrachtet, wird feststellen, dass ein Großteil der Platine von GDDR5-Speicherchips und ihren jeweils 32 Bit breiten Datenleitungen zum Grafikprozessor belegt ist. Dieses aufwendige und teure Verfahren ist notwendig, um die erforderliche hohe Datentransferrate hin zur GPU zu ermöglichen, damit deren Recheneinheiten nicht verhungern.

Stellenmarkt
  1. Bosch Software Innovations GmbH, Waiblingen
  2. tecmata GmbH, Wiesbaden

Abseits vom Platzbedarf auf der Platine ist die Leistungsaufnahme ein großes Problem: Bei heutigen High-End-Grafikkarten sind die Speicherchips und der Controller in der GPU für gut ein Drittel des Strombedarfs verantwortlich, was bis zu 80 Watt entspricht. Eine Alternative zu einem breiten Speicher-Interface sind größere Zwischenpuffer in der GPU selbst, wodurch die aber größer wird und teurer zu fertigen ist.

  • 3D-Stacking mit DRAM auf dem SoC und 2,5D-Stacking mit DRAM und SoC auf einem Interposer (Bild: AMD)
  • Samsung 850 Evo mit 1 TByte und 512 GByte (Bild: Anandtech)
  • Aus planaren Zellen werden mit 3D-NAND-Flash gestapelte Zylinder. (Bild: Samsung)
  • In der 850 Pro/Evo sind 32 Zellschichten gestapelt. (Bild: Samsung)
  • Ein 3D-NAND-Flash-Siliziumplättchen (Bild: Samsung)
  • Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)
  • Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)
  • Wire Bonding und Through Silicon Vias (Bild: AMD)
  • Through Silicon Vias im Detail (Bild: AMD)
  • Through Silicon Vias sind viel dünner als menschliche Haare. (Bild: AMD)
  • Die beiden bisherigen HBM-Generationen im Überblick (Bild: SK Hynix)
  • Die erste HBM-Generation im Vergleich mit DDR3 und GDDR5 (Bild: SK Hynix)
  • Die erste HBM-Generation besteht aus vier DRAM-Chips mit je zwei 128-Bit-Kanälen. (Bild: SK Hynix)
  • Mockup einer Platine ohne echten Pascal-Chip oder HBM (Bild: Nvidia)
  • Ein Hybrid Memory Cube (Bild: Micron)
  • Aufbau und Verbindung eines Hybrid Memory Cube (Bild: Micron)
  • 1-GBit-Dies eines Hybrid Memory Cube (Bild: Micron)
  • Die Logikschicht ist beim Hybrid Memory Cube obligatorisch. (Bild: Micron)
  • Die fünf Schichten eines Hybrid Memory Cube (Bild: Micron)
  • Knights Landing soll 2015 erscheinen. (Bild: Intel)
  • Knights Landing bietet 16 GByte HMC-Speicher mit 480 GByte/s. (Bild: Intel)
  • Ohne die kompakte Platine müsste der Akku kleiner sein. (Bild: iFixit)
  • Unter dem A7-Deckel sitzen ein DRAM-Chip und das SoC. (Bild: iFixit)
  • (LP)DDR4 und Stapelspeicher gehört die Zukunft. (Bild: Jedec)
  • Größenvergleich von DDR4 und HBM (Bild: SK Hynix)
Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)

Nvidia hat beispielsweise beim GM204-Chip der Geforce GTX 980 ein 256- statt ein 384-Bit-Interface verbaut, wie es beim GK110-Chip der Geforce GTX 780 Ti eingesetzt wird. Der L1-Cache pro Shader-Block aber fasst 96 statt 64 KByte und der L2-Cache der GPU ist 2 statt 1,5 MByte groß. Zum Vergleich: Der GK104-Chip in der Geforce GTX 680, der Vorgänger des GM204, kann in seinem L2-Puffer nur 512 KByte zwischenspeichern.

Ein anderes Dilemma gibt es bei Prozessoren mit integrierten Grafikeinheiten: Die GPU muss sich mit den CPU-Kernen die Datentransferrate teilen. Bei zwei 64 Bit breiten Speicherkanälen sind selbst mit DDR3-2133 nur rund 34 GByte pro Sekunde drin - zu wenig für die schnellsten integrierten Grafikeinheiten wie die R7 Radeon oder die Iris Pro 5200.

Als Puffer zwischen den rasend schnellen Caches und dem vergleichsweise lahmen DDR3-Speicher hat Intel daher EDRAM verbaut. Der Embedded Dynamic Random Access Memory besteht aus acht Blöcken und einem monströsen 1.024-Bit-Interface. Der Trick hierbei nennt sich On-Package I/O: Statt Datenleitung über die Platine zu verlegen, sitzen Prozessor wie EDRAM auf dem gleichen Substrat, einem Interposer, und sind nur 1,5 mm voneinander entfernt.

  • 3D-Stacking mit DRAM auf dem SoC und 2,5D-Stacking mit DRAM und SoC auf einem Interposer (Bild: AMD)
  • Samsung 850 Evo mit 1 TByte und 512 GByte (Bild: Anandtech)
  • Aus planaren Zellen werden mit 3D-NAND-Flash gestapelte Zylinder. (Bild: Samsung)
  • In der 850 Pro/Evo sind 32 Zellschichten gestapelt. (Bild: Samsung)
  • Ein 3D-NAND-Flash-Siliziumplättchen (Bild: Samsung)
  • Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)
  • Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)
  • Wire Bonding und Through Silicon Vias (Bild: AMD)
  • Through Silicon Vias im Detail (Bild: AMD)
  • Through Silicon Vias sind viel dünner als menschliche Haare. (Bild: AMD)
  • Die beiden bisherigen HBM-Generationen im Überblick (Bild: SK Hynix)
  • Die erste HBM-Generation im Vergleich mit DDR3 und GDDR5 (Bild: SK Hynix)
  • Die erste HBM-Generation besteht aus vier DRAM-Chips mit je zwei 128-Bit-Kanälen. (Bild: SK Hynix)
  • Mockup einer Platine ohne echten Pascal-Chip oder HBM (Bild: Nvidia)
  • Ein Hybrid Memory Cube (Bild: Micron)
  • Aufbau und Verbindung eines Hybrid Memory Cube (Bild: Micron)
  • 1-GBit-Dies eines Hybrid Memory Cube (Bild: Micron)
  • Die Logikschicht ist beim Hybrid Memory Cube obligatorisch. (Bild: Micron)
  • Die fünf Schichten eines Hybrid Memory Cube (Bild: Micron)
  • Knights Landing soll 2015 erscheinen. (Bild: Intel)
  • Knights Landing bietet 16 GByte HMC-Speicher mit 480 GByte/s. (Bild: Intel)
  • Ohne die kompakte Platine müsste der Akku kleiner sein. (Bild: iFixit)
  • Unter dem A7-Deckel sitzen ein DRAM-Chip und das SoC. (Bild: iFixit)
  • (LP)DDR4 und Stapelspeicher gehört die Zukunft. (Bild: Jedec)
  • Größenvergleich von DDR4 und HBM (Bild: SK Hynix)
Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)

Der On-Package I/O überbrückt diesen Abstand sehr energiesparend, der Datentransfer benötigt gerade einmal 1 Watt und erreicht 102 GByte pro Sekunde. Das ist mehr als bei einer Radeon R7 260X mit GDDDR5 - aber: Der EDRAM fasst einzig 128 MByte und dient somit vielmehr als L4-Cache denn als Videospeicher.

Das Problem, der energiehungrige GDDR5- oder der langsame DDR3-Speicher, wird also auch mit EDRAM nur vor sich hergeschoben. Eine Alternative hat das Speichergremium Jedec längst spezifiziert - den von AMD und SK Hynix entwickelten High Bandwidth Memory, kurz HBM.

 Geschichtete SpeicherzylinderKleiner High Bandwidth Memory 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Top-Angebote
  1. 79,90€ + 5,99€ Versand (Vergleichspreis ca. 116€)
  2. 55,11€ (Bestpreis!)
  3. 17,49€
  4. 299€ + 4,99€ Versand oder Abholung im Markt

Moosbuckel 23. Dez 2014

ebenfalls ein danke von mir

Anonymer Nutzer 19. Dez 2014

Soll er ruhig,wenn er dafür 4 Terabyte zwischenspeichern kann.^^

Dai 18. Dez 2014

Golem hat sich vielleicht etwas ungeschickt ausgedrückt im Grunde ist Hearthstone aber...

ms (Golem.de) 18. Dez 2014

Das Package-Substrat ist idR FR4, der Interposer drüber aus Silizium.

Ach 18. Dez 2014

Da kommt ja wieder sowas wie ne handfeste Aufbruchstimmung auf. Rein geometrisch gesehen...


Folgen Sie uns
       


Kameravergleich Smartphones

Samsungs Galaxy S9+ macht gute Fotos - auch im Vergleich zur Konkurrenz, wie unser Vergleichstest zeigt.

Kameravergleich Smartphones Video aufrufen
Dell XPS 13 (9370) im Test: Sehr gut ist nicht besser
Dell XPS 13 (9370) im Test
Sehr gut ist nicht besser

Mit dem XPS 13 (9370) hat Dell sein bisher exzellentes Ultrabook in nahezu allen Bereichen überarbeitet - und es teilweise verschlechtert. Der Akku etwa ist kleiner, das spiegelnde Display nervt. Dafür überzeugen die USB-C-Ports, die Kühlung sowie die Tastatur, und die Webcam wurde sinnvoller.
Ein Test von Marc Sauter und Sebastian Grüner

  1. Ultrabook Dell hat das XPS 13 ruiniert
  2. XPS 13 (9370) Dells Ultrabook wird dünner und läuft kürzer
  3. Ultrabook Dell aktualisiert XPS 13 mit Quadcore-Chip

Datenschutz: Der Nutzer ist willig, doch die AGB sind schwach
Datenschutz
Der Nutzer ist willig, doch die AGB sind schwach

Verbraucher verstehen die Texte oft nicht wirklich, in denen Unternehmen erklären, wie ihre Daten verarbeitet werden. Datenschutzexperten und -forscher suchen daher nach praktikablen Lösungen.
Ein Bericht von Christiane Schulzki-Haddouti

  1. Soziales Netzwerk Facebook will in Deutschland Vertrauen wiedergewinnen
  2. Denial of Service Facebook löscht Cybercrime-Gruppen mit 300.000 Mitgliedern
  3. Vor Anhörungen Zuckerberg nimmt alle Schuld auf sich

HP Z2 Mini Workstation G3 im Test: Leises Rauschen hinterm Monitor
HP Z2 Mini Workstation G3 im Test
Leises Rauschen hinterm Monitor

Unterm Tisch, auf dem Tisch oder hinter den Bildschirm geklemmt: HPs Z2 Mini Workstation ist ein potentes, wenn auch nicht gerade sehr preiswertes Komplettsystem. Den Preis ist der PC aber wert, denn er ist leise, modular und kann einfach gewartet werden. Der Admin dankt!
Ein Test von Oliver Nickel

  1. HP Pavilion Gaming Hardware für Gamer, die sich Omen nicht leisten wollen
  2. Chromebook x2 HP präsentiert Chrome-OS-Detachable mit Stift
  3. Laserjet Pro M15w und M28w HPs Laserdrucker schrumpfen auf 34 Zentimeter Länge

    •  /