Codename Fiji: AMD erklärt High Bandwidth Memory der neuen Grafikkarte

Eine höhere Datentransfer-Rate und dennoch sparsamer: Golem.de hat mit AMDs Technik-Chef über Details zum High Bandwidth Memory, der für die kommende Fiji-Grafikkarte statt GDDR5 als Videospeicher verwendet wird, gesprochen. Einziger vermeintlicher Nachteil ist die derzeit verfügbare Kapazität.

Artikel veröffentlicht am ,
Platine mit GPU und vier HBM-Stacks
Platine mit GPU und vier HBM-Stacks (Bild: AMD)

AMDs nächste High-End-Grafikkarte, Codename Fiji, wird die erste mit High Bandwidth Memory (HBM). Dieser Stapelspeicher ist für Golem.de-Leser nicht neu, schon im Dezember 2014 berichteten wir ausführlich über High Bandwidth Memory und andere Speicher-Technologien. AMD hatte den Einsatz von HBM für eine mit dem Fiji-Chip ausgerüstete Grafikkarte auf dem Financial Analyst Day angekündigt, in einem Briefing ging der Hersteller auf Details ein. Wir sprachen direkt mit AMDs Technik-Chef Joe Macri über den High Bandwidth Memory und dessen Implementierung in künftigen Produkten.

Stellenmarkt
  1. Junior Network Engineer - Firewall (m/w/d)
    STRABAG BRVZ GMBH & CO.KG, Köln, Stuttgart
  2. IT Security Specialist (m/w/d)
    Amprion GmbH, Dortmund
Detailsuche

Vorab ein paar Hintergrundinformationen: Der seit vielen Jahren bei Grafikkarten übliche Videospeicher ist GDDR5; einzig sehr günstige Modelle nutzen DDR3-Speicher. Um mit GDDR5 die für heutige Grafikkarte notwendige Datentransfer-Rate zu erzielen und 4 oder mehr GByte zu verbauen, ist eine aufwendige Platine notwendig. AMDs Radeon R9 290X etwa nutzt ein 512 Bit breites Speicher-Interface, und an jedem 32-Bit-Kanal hängt ein Speicherchip. Alle 16 zusammen ergeben 4 oder 8 GByte, Workstation-Karten wie Fire Pro W9100 erreichen 16 GByte mit 32 Speicherbausteinen.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

High Bandwidth Memory löst die Problematik vergleichsweise elegant: Statt eine Vielzahl an Speicherpackages samt Leitungen auf die Platine zu packen, werden DRAM-Dies gestapelt und als sogenannte Stacks direkt neben dem Grafikchip platziert - die GPU darf also nicht zu groß sein. Beide Bausteine sind durch einen Interposer verbunden, dieser wird bei UMC hergestellt. Der Interposer ist eine spezielle Silizium-Schicht, durch diese wird das Interface gelegt. Auch wenn keine aktiven Bauteile im Interposer stecken, macht dies die Grafikkarte teurer. Das Interface fällt dafür beim Grafikchip etwas kleiner aus als mit GDDR5 und spart somit Energie und wichtige Die-Fläche.

Auch Stacks nehmen weniger elektrische Leistung auf als GDDR5-Speicher, AMD selbst nennt die Hälfte bei gleicher Geschwindigkeit. Interessant ist die angegebene Spannung von 1,3 Volt bei 1 GHz - bisherige Dokumente sprechen von 1,2 Volt. Jeder Stack taktet mit 1 GHz und ist per 1.024-Bit-Interface an den Grafikchip angebunden, insgesamt ergibt dies 512 GByte pro Sekunde. Das ist mehr als heutige GDDR5-Speichersysteme schaffen, wohlgemerkt bei niedrigerer Leistungsaufnahme. Das freiwerdende Energie-Budget steckt AMD in mehr Shader-Einheiten, die TDP von Fiji soll der Radeon R9 290X nicht übersteigen.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

4 GByte Videospeicher noch nicht offiziell

Golem Karrierewelt
  1. Kubernetes – das Container Orchestration Framework: virtueller Vier-Tage-Workshop
    11.-14.07.2022, Virtuell
  2. Cinema 4D Grundlagen: virtueller Drei-Tage-Workshop
    04.-06.07.2022, Virtuell
Weitere IT-Trainings

Der neue Speicherstandard wurde vom Jedec-Konsortium spezifiziert, einziger Fertiger ist derzeit Hynix. Offiziell verfügbar sind Stacks mit vier DRAM-Dies mit je 2 GBit. Ein solcher 4-Hi-Stack bietet also 1 GByte Speicher und zumindest AMDs - von Macri als Cartoons bezeichneten - Schaubildern zufolge ist rund um die GPU nur Platz für vier davon. Das würde 4 GByte Videospeicher für die im Juni erscheinende Fiji-Grafikkarte bedeuten, theoretisch sind aber auch mehr Kapazität pro Die, mehr Dies pro Stack oder mehr Stapel denkbar. Die Fiji-Karte soll unseren Informationen nach eine neue Namensgebung erhalten.

AMD wollte die 4 GByte nicht bestätigen, Joe Macri sagte Golem.de aber, AMD arbeite daran, den Videospeicher möglichst effizient zu nutzen. Heutige Architekturen würden dies nicht machen, da ein breiteres Interface bisher nahezu durchgehend mit mehr Speicher einherging. Auch Nvidia forscht an neuen Techniken um den Footprint zu veringern, etwa an ACAA, einer Kantenglättungsmethode für Forward-Renderer. Die wenigsten Spiele nutzen jedoch mehr als 4 GByte Videospeicher, selbst in 4K.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

Die Platine wird Macri zufolge vergleichsweise kurz, der Grafikchip wie auch die HBM-Stacks sind auf gleicher Höhe angeordnet und werden gemeinsam von einer Wasserkühlung abgedeckt. Die früher genannte 8-GByte-Karte könnte erst in einigen Monaten erscheinen, wenn 8-Hi-Stacks mit halbiertem Interface pro DRAM-Die und verdoppelter Kapazität fertig sind.

Eine künftige FirePro-Karte könnte gleich auf eine überarbeitete HBM-Version mit 4 GByte pro Stack - also 16 GByte - setzen. Ähnlich geht Nvidia vor, deren Pascal-Chip verfügt über bis zu 32 GByte. AMD arbeitet zudem an einem HPC-Chip mit Zen-Prozessorkernen, einer integrierten Grafikeinheit und High Bandwidth Memory.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


CochainComplex 15. Jun 2015

Das Problem von Hochgeschwindigkeitstechniken sind in erster Linie die Leitungen und...



Aktuell auf der Startseite von Golem.de
US-Streaming
Abonnenten immer unzufriedener mit Netflix

Wenn Netflix-Abonnenten das Abo kündigen, wird vor allem der hohe Preis sowie ein schlechtes Preis-Leistungs-Verhältnis als Grund dafür genannt.

US-Streaming: Abonnenten immer unzufriedener mit Netflix
Artikel
  1. Machine Learning: Die eigene Stimme als TTS-Modell
    Machine Learning
    Die eigene Stimme als TTS-Modell

    Mit Machine Learning kann man ein lokal lauffähiges und hochwertiges TTS-Modell der eigenen Stimme herstellen. Dauert das lange? Ja. Braucht man das? Nein. Ist das absolut nerdig? Definitv!
    Eine Anleitung von Thorsten Müller

  2. Elektro-SUV: Drako Dragon soll Teslas Model X Plaid deutlich übertreffen
    Elektro-SUV
    Drako Dragon soll Teslas Model X Plaid deutlich übertreffen

    Das Elektroauto Drako Dragon soll mit seinen vier Motoren eine Leistung von 1.470 kW entwickeln und 320 km/h Spitze fahren.

  3. Discovery+: Neues Streamingabo in Deutschland verfügbar
    Discovery+
    Neues Streamingabo in Deutschland verfügbar

    Während etwa Netflix oder Disney werbefinanzierte Varianten ihrer Abos planen, startet Discovery+ gleich mit einem solchen Dienst.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI RTX 3080 Ti Ventus 3X 12G OC 1.049€ • Alternate (u. a. Corsair Vengeance LPX 32 GB DDR4-3600 106,89€) • be quiet! Pure Rock 2 26,99€ • SanDisk microSDXC 400 GB 29€ • The Quarry + PS5-Controller 99,99€ • Samsung Galaxy Watch 3 119€ • Top-PC mit Ryzen 7 & RTX 3070 Ti 1.700€ [Werbung]
    •  /