Grafikchip: AMD zeigt Vega 10 und erläutert Architektur

Große Veränderungen bei der Vega-Generation: AMD hat HBM2-Stapelspeicher als schnellen Cache, neue Shader-Einheiten und eine verbesserte Geometrie- sowie Rasterizer-Stufe integriert. Hinzu kommt eine hohe FP32/FP16-Leistung und der Vega-10-Chip erweist sich in Doom als flott.

Artikel veröffentlicht am ,
Raja Koduri zeigt den Vega-10-Chip.
Raja Koduri zeigt den Vega-10-Chip. (Bild: Marc Sauter/Golem.de)

AMD hat auf dem Tech Summit im kalifornischen Sonoma erste eigene Informationen zur kommenden Vega-Grafikarchitektur und dem darauf basierenden Vega-10-Grafikchip bekanntgegeben. Eigene deshalb, weil Golem.de-Leser die Neuerung teils schon kennen, denn Sony verwendet in der Playstation 4 Pro eine GPU, die viele Ideen der Vega-Generation beinhaltet. Vor Ort zeigte AMD zwar keine Consumer-Produkte auf Basis eines Vega-Grafikchips, stellte aber ein Prototypsystem mit Doom aus und kündigte den Deep-Learning-Beschleuniger Radeon Instinct MI25 an.

Inhalt:
  1. Grafikchip: AMD zeigt Vega 10 und erläutert Architektur
  2. Front- wie Backend aufgemöbelt

Fünf Jahre lang will AMD an der Vega-Architektur gearbeitet haben, die Technologie soll verglichen mit Polaris über 200 Neuerungen umfassen. Allerdings konkretisierte der Hersteller nicht, was alles aufaddiert wurde. Ungeachtet dessen ist klar, dass AMD zumindest mit dem Vega-10-Chip wieder Marktsegmente anvisiert, die in den vergangenen Jahren vernachlässigt wurden oder durch Vega überhaupt erst erschlossen werden sollen. Als Zeitraum für die Veröffentlichung wurde das erste Halbjahr 2017 genannt.

Laut AMD etwas unter 500 Quadratmillimeter groß

Da AMDs Grafikchef Raja Koduri den Vega-10-Chip bereitwillig für Fotos hochhielt, können wir eine grobe Aussage zur Größe treffen: Die im 14LPP-Verfahren gefertigte GPU dürfte 500 bis 550 mm² aufweisen [Update: AMDs Raja Koduri sagte uns, Vega 10 sei etwas kleiner als 500 mm²]. Damit ist der Grafikchip voluminöser als der Polaris 10 einer Radeon RX 480 (232 mm²), der GP104 einer Geforce GTX 1080 (314 mm²) und der GP102 einer Titan X (471 mm²), aber kompakter als der monströse GP100 einer Tesla P100 (610 mm²). Die werden übrigens alle mit 14LPP-Technik oder 16FF+ gefertigt, sind also vom Prozess-Node her direkt vergleichbar.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)

Die Fläche des Vega 10 können wir übrigens nur deshalb einigermaßen abschätzen, weil der Chip nach dem Fiji der Fury X der zweite von AMD mit High Bandwidth Memory ist. Konkret verwendet AMD zwei HBM2-Stacks, die jeweils per 1.024 Bit breitem Interface angebunden sind und mit 2 GHz takten. Das ergibt eine Datentransferrate von 512 GByte pro Sekunde, also so viel wie bei der Fury X mit vier HBM1-Stacks mit jeweils 1 GHz. AMD spricht beim Vega 10 von einem High Bandwidth Cache (HBC), da die Speicherarchitektur laut Hersteller massiv von bisherigen Implementierungen abweicht.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
Stellenmarkt
  1. IT System Engineer / Systemadministratorin / -administrator - Endpoint Management
    Universitätsklinikum Frankfurt, Frankfurt am Main
  2. IT Systemadministrator*in (m/w/d) 100 % Homeoffice / Remote
    Wikando GmbH, verschiedene Einsatzorte
Detailsuche

Mit im Chip sitzt ein Speichercontroller, der High Bandwidth Cache Controller (HBCC) heißt. Er verwaltet den HBM2 und soll laut AMD bis zu 512 TByte als virtuellen Adressraum (49 Bit) nutzen, um weitaus mehr Daten als bisher üblich verarbeiten zu können - per Paging in etwa dem RAM oder einer SSD. Als Beispiel diente eine Demo in Radeon ProRender, einem Path Tracer. Die gezeigte Szene in einem Haus soll 200 GByte verwenden und würde dank des High Bandwidth Cache Controllers mit höherer Bildrate dargestellt als ohne. Denkbar sei es laut AMD, den HBM als exklusiven oder inklusiven Cache zu nutzen und zusätzlich Flash-Speicher oder Storage Class Memory einzubinden, was auf eine weitere Radeon Pro SSG hinweisen könnte.

All die Daten im HBM2 bringen aber nichts, wenn der Vega-10-Chip sie nicht effizient verarbeitet. Daher hat AMD vorne wie hinten Verbesserungen implementiert, etwa bei der wichtigen Geometriestufe.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Front- wie Backend aufgemöbelt 
  1. 1
  2. 2
  3.  


Aktuell auf der Startseite von Golem.de
Apple Watch Ultra im Test
Tolle Sportuhr - und trotzdem Trainingsbedarf

Akkulaufzeit, Navigation und das Ökosystem: Golem.de ist mit der für ausdauernde Athleten gedachten Sportuhr Apple Watch Ultra unterwegs gewesen.
Von Peter Steinlechner

Apple Watch Ultra im Test: Tolle Sportuhr - und trotzdem Trainingsbedarf
Artikel
  1. Deutscher Entwicklerpreis: Entwickler küren The Wandering Village zum besten Spiel
    Deutscher Entwicklerpreis
    Entwickler küren The Wandering Village zum besten Spiel

    Beste technische Leistung, Innovationspreis und bestes Spiel: The Wandering Village ist der große Gewinner beim Deutschen Entwicklerpreis 2022.

  2. Finanzierung: 49-Euro-Ticket kommt - aber wann?
    Finanzierung
    49-Euro-Ticket kommt - aber wann?

    Die Finanzierungsfragen für das 49-Euro-Ticket sind offenbar geklärt, so dass das subventionierte Nahverkehrsticket kommen kann. Die Frage ist nur wann.

  3. Responsible Disclosure: Obi macht das Melden einer Sicherheitslücke schwer
    Responsible Disclosure
    Obi macht das Melden einer Sicherheitslücke schwer

    Ein Sicherheitsforscher hat eine Lücke bei mehreren Unternehmen und Stadtverwaltungen gemeldet. Obi machte es ihm besonders schwer.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Asus RTX 4080 1.399€ • PS5 bestellbar • Gaming-Laptops & Desktop-PCs -29% • MindStar: Sapphire RX 6900 XT 799€ statt 1.192€, Apple iPad (2022) 256 GB 599€ statt 729€ • Samsung SSDs -28% • Logitech Mäuse, Tastaturen & Headsets -53% • Google Pixel 6 & 7 -49% • [Werbung]
    •  /