Abo
  • Services:
Anzeige
Vier gestapelte Dies eines Speicherchips für einen Hybrid Memory Cube
Vier gestapelte Dies eines Speicherchips für einen Hybrid Memory Cube (Bild: Micron)

Was bei GDDR5 schiefläuft

Wer eine aktuelle Grafikkarte ohne Kühler genauer betrachtet, wird feststellen, dass ein Großteil der Platine von GDDR5-Speicherchips und ihren jeweils 32 Bit breiten Datenleitungen zum Grafikprozessor belegt ist. Dieses aufwendige und teure Verfahren ist notwendig, um die erforderliche hohe Datentransferrate hin zur GPU zu ermöglichen, damit deren Recheneinheiten nicht verhungern.

Abseits vom Platzbedarf auf der Platine ist die Leistungsaufnahme ein großes Problem: Bei heutigen High-End-Grafikkarten sind die Speicherchips und der Controller in der GPU für gut ein Drittel des Strombedarfs verantwortlich, was bis zu 80 Watt entspricht. Eine Alternative zu einem breiten Speicher-Interface sind größere Zwischenpuffer in der GPU selbst, wodurch die aber größer wird und teurer zu fertigen ist.

Anzeige
  • 3D-Stacking mit DRAM auf dem SoC und 2,5D-Stacking mit DRAM und SoC auf einem Interposer (Bild: AMD)
  • Samsung 850 Evo mit 1 TByte und 512 GByte (Bild: Anandtech)
  • Aus planaren Zellen werden mit 3D-NAND-Flash gestapelte Zylinder. (Bild: Samsung)
  • In der 850 Pro/Evo sind 32 Zellschichten gestapelt. (Bild: Samsung)
  • Ein 3D-NAND-Flash-Siliziumplättchen (Bild: Samsung)
  • Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)
  • Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)
  • Wire Bonding und Through Silicon Vias (Bild: AMD)
  • Through Silicon Vias im Detail (Bild: AMD)
  • Through Silicon Vias sind viel dünner als menschliche Haare. (Bild: AMD)
  • Die beiden bisherigen HBM-Generationen im Überblick (Bild: SK Hynix)
  • Die erste HBM-Generation im Vergleich mit DDR3 und GDDR5 (Bild: SK Hynix)
  • Die erste HBM-Generation besteht aus vier DRAM-Chips mit je zwei 128-Bit-Kanälen. (Bild: SK Hynix)
  • Mockup einer Platine ohne echten Pascal-Chip oder HBM (Bild: Nvidia)
  • Ein Hybrid Memory Cube (Bild: Micron)
  • Aufbau und Verbindung eines Hybrid Memory Cube (Bild: Micron)
  • 1-GBit-Dies eines Hybrid Memory Cube (Bild: Micron)
  • Die Logikschicht ist beim Hybrid Memory Cube obligatorisch. (Bild: Micron)
  • Die fünf Schichten eines Hybrid Memory Cube (Bild: Micron)
  • Knights Landing soll 2015 erscheinen. (Bild: Intel)
  • Knights Landing bietet 16 GByte HMC-Speicher mit 480 GByte/s. (Bild: Intel)
  • Ohne die kompakte Platine müsste der Akku kleiner sein. (Bild: iFixit)
  • Unter dem A7-Deckel sitzen ein DRAM-Chip und das SoC. (Bild: iFixit)
  • (LP)DDR4 und Stapelspeicher gehört die Zukunft. (Bild: Jedec)
  • Größenvergleich von DDR4 und HBM (Bild: SK Hynix)
Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)

Nvidia hat beispielsweise beim GM204-Chip der Geforce GTX 980 ein 256- statt ein 384-Bit-Interface verbaut, wie es beim GK110-Chip der Geforce GTX 780 Ti eingesetzt wird. Der L1-Cache pro Shader-Block aber fasst 96 statt 64 KByte und der L2-Cache der GPU ist 2 statt 1,5 MByte groß. Zum Vergleich: Der GK104-Chip in der Geforce GTX 680, der Vorgänger des GM204, kann in seinem L2-Puffer nur 512 KByte zwischenspeichern.

Ein anderes Dilemma gibt es bei Prozessoren mit integrierten Grafikeinheiten: Die GPU muss sich mit den CPU-Kernen die Datentransferrate teilen. Bei zwei 64 Bit breiten Speicherkanälen sind selbst mit DDR3-2133 nur rund 34 GByte pro Sekunde drin - zu wenig für die schnellsten integrierten Grafikeinheiten wie die R7 Radeon oder die Iris Pro 5200.

Als Puffer zwischen den rasend schnellen Caches und dem vergleichsweise lahmen DDR3-Speicher hat Intel daher EDRAM verbaut. Der Embedded Dynamic Random Access Memory besteht aus acht Blöcken und einem monströsen 1.024-Bit-Interface. Der Trick hierbei nennt sich On-Package I/O: Statt Datenleitung über die Platine zu verlegen, sitzen Prozessor wie EDRAM auf dem gleichen Substrat, einem Interposer, und sind nur 1,5 mm voneinander entfernt.

  • 3D-Stacking mit DRAM auf dem SoC und 2,5D-Stacking mit DRAM und SoC auf einem Interposer (Bild: AMD)
  • Samsung 850 Evo mit 1 TByte und 512 GByte (Bild: Anandtech)
  • Aus planaren Zellen werden mit 3D-NAND-Flash gestapelte Zylinder. (Bild: Samsung)
  • In der 850 Pro/Evo sind 32 Zellschichten gestapelt. (Bild: Samsung)
  • Ein 3D-NAND-Flash-Siliziumplättchen (Bild: Samsung)
  • Eine Radeon R9 290X mit 512 Bit Interface und 16 GDDR5-Bausteinen (Bild: Techpowerup)
  • Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)
  • Wire Bonding und Through Silicon Vias (Bild: AMD)
  • Through Silicon Vias im Detail (Bild: AMD)
  • Through Silicon Vias sind viel dünner als menschliche Haare. (Bild: AMD)
  • Die beiden bisherigen HBM-Generationen im Überblick (Bild: SK Hynix)
  • Die erste HBM-Generation im Vergleich mit DDR3 und GDDR5 (Bild: SK Hynix)
  • Die erste HBM-Generation besteht aus vier DRAM-Chips mit je zwei 128-Bit-Kanälen. (Bild: SK Hynix)
  • Mockup einer Platine ohne echten Pascal-Chip oder HBM (Bild: Nvidia)
  • Ein Hybrid Memory Cube (Bild: Micron)
  • Aufbau und Verbindung eines Hybrid Memory Cube (Bild: Micron)
  • 1-GBit-Dies eines Hybrid Memory Cube (Bild: Micron)
  • Die Logikschicht ist beim Hybrid Memory Cube obligatorisch. (Bild: Micron)
  • Die fünf Schichten eines Hybrid Memory Cube (Bild: Micron)
  • Knights Landing soll 2015 erscheinen. (Bild: Intel)
  • Knights Landing bietet 16 GByte HMC-Speicher mit 480 GByte/s. (Bild: Intel)
  • Ohne die kompakte Platine müsste der Akku kleiner sein. (Bild: iFixit)
  • Unter dem A7-Deckel sitzen ein DRAM-Chip und das SoC. (Bild: iFixit)
  • (LP)DDR4 und Stapelspeicher gehört die Zukunft. (Bild: Jedec)
  • Größenvergleich von DDR4 und HBM (Bild: SK Hynix)
Eine Core i7-4570R mit EDRAM auf dem gleichen Träger (Bild: iFixit)

Der On-Package I/O überbrückt diesen Abstand sehr energiesparend, der Datentransfer benötigt gerade einmal 1 Watt und erreicht 102 GByte pro Sekunde. Das ist mehr als bei einer Radeon R7 260X mit GDDDR5 - aber: Der EDRAM fasst einzig 128 MByte und dient somit vielmehr als L4-Cache denn als Videospeicher.

Das Problem, der energiehungrige GDDR5- oder der langsame DDR3-Speicher, wird also auch mit EDRAM nur vor sich hergeschoben. Eine Alternative hat das Speichergremium Jedec längst spezifiziert - den von AMD und SK Hynix entwickelten High Bandwidth Memory, kurz HBM.

 Geschichtete SpeicherzylinderKleiner High Bandwidth Memory 

eye home zur Startseite
Moosbuckel 23. Dez 2014

ebenfalls ein danke von mir

Anonymer Nutzer 19. Dez 2014

Soll er ruhig,wenn er dafür 4 Terabyte zwischenspeichern kann.^^

Dai 18. Dez 2014

Golem hat sich vielleicht etwas ungeschickt ausgedrückt im Grunde ist Hearthstone aber...

ms (Golem.de) 18. Dez 2014

Das Package-Substrat ist idR FR4, der Interposer drüber aus Silizium.

Ach 18. Dez 2014

Da kommt ja wieder sowas wie ne handfeste Aufbruchstimmung auf. Rein geometrisch gesehen...



Anzeige

Stellenmarkt
  1. Robert Bosch GmbH, Abstatt
  2. Fresenius Medical Care Deutschland GmbH, Bad Homburg
  3. MKB Mittelrheinische Bank GmbH, Koblenz
  4. Lernstudio Barbarossa GmbH, Kaiserslautern


Anzeige
Spiele-Angebote
  1. 8,99€
  2. (-15%) 16,99€

Folgen Sie uns
       


  1. Knappe Mehrheit

    SPD stimmt für Koalitionsverhandlungen mit Union

  2. Gerichtspostfach

    EGVP-Client kann weiter genutzt werden

  3. DLD-Konferenz

    Gabriel warnt vor digitalem Schlachtfeld Europa

  4. NetzDG

    Streit mit EU über 100-Prozent-Löschquote in Deutschland

  5. Facebook

    Nutzer sollen Vertrauenswürdigkeit von Newsquellen bewerten

  6. Notebook-Grafik

    Nvidia hat eine Geforce GTX 1050 (Ti) mit Max-Q

  7. Gemini Lake

    Asrock und Gigabyte bringen Atom-Boards

  8. Eni HPC4

    Italienischer Supercomputer weltweit einer der schnellsten

  9. US-Wahl 2016

    Twitter findet weitere russische Manipulationskonten

  10. Die Woche im Video

    Das muss doch einfach schneller gehen!



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Sgnl im Hands on: Sieht blöd aus, funktioniert aber
Sgnl im Hands on
Sieht blöd aus, funktioniert aber
  1. NGSFF alias M.3 Adata zeigt seine erste SSD mit breiterer Platine
  2. Displaytechnik Samsung soll faltbares Smartphone auf CES gezeigt haben
  3. Vuzix Blade im Hands on Neue Datenbrille mit einem scharfen und hellen Bild

EU-Urheberrechtsreform: Abmahnungen treffen "nur die Dummen"
EU-Urheberrechtsreform
Abmahnungen treffen "nur die Dummen"
  1. Leistungsschutzrecht EU-Kommission hält kritische Studie zurück
  2. Leistungsschutzrecht EU-Staaten uneins bei Urheberrechtsreform

Security: Das Jahr, in dem die Firmware brach
Security
Das Jahr, in dem die Firmware brach
  1. Wallet Programmierbare Kreditkarte mit ePaper, Akku und Mobilfunk
  2. Fehlalarm Falsche Raketenwarnung verunsichert Hawaii
  3. Asynchronous Ratcheting Tree Facebook demonstriert sicheren Gruppenchat für Apps

  1. Re: schön die datenblätter zitiert

    Sarkastius | 05:19

  2. Re: Löschqopute irrelevant

    ThaKilla | 05:18

  3. Re: 1050 und dann noch langsamer?

    Sarkastius | 04:35

  4. Re: Endlich wieder neue Mini-ITX mit CPU

    Crogge | 04:23

  5. Re: Head of Problem !!

    superdachs | 03:20


  1. 16:59

  2. 14:13

  3. 13:15

  4. 12:31

  5. 14:35

  6. 14:00

  7. 13:30

  8. 12:57


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel