Abo
  • Services:

Grafikchip: AMD zeigt Vega 10 und erläutert Architektur

Große Veränderungen bei der Vega-Generation: AMD hat HBM2-Stapelspeicher als schnellen Cache, neue Shader-Einheiten und eine verbesserte Geometrie- sowie Rasterizer-Stufe integriert. Hinzu kommt eine hohe FP32/FP16-Leistung und der Vega-10-Chip erweist sich in Doom als flott.

Artikel veröffentlicht am ,
Raja Koduri zeigt den Vega-10-Chip.
Raja Koduri zeigt den Vega-10-Chip. (Bild: Marc Sauter/Golem.de)

AMD hat auf dem Tech Summit im kalifornischen Sonoma erste eigene Informationen zur kommenden Vega-Grafikarchitektur und dem darauf basierenden Vega-10-Grafikchip bekanntgegeben. Eigene deshalb, weil Golem.de-Leser die Neuerung teils schon kennen, denn Sony verwendet in der Playstation 4 Pro eine GPU, die viele Ideen der Vega-Generation beinhaltet. Vor Ort zeigte AMD zwar keine Consumer-Produkte auf Basis eines Vega-Grafikchips, stellte aber ein Prototypsystem mit Doom aus und kündigte den Deep-Learning-Beschleuniger Radeon Instinct MI25 an.

Inhalt:
  1. Grafikchip: AMD zeigt Vega 10 und erläutert Architektur
  2. Front- wie Backend aufgemöbelt

Fünf Jahre lang will AMD an der Vega-Architektur gearbeitet haben, die Technologie soll verglichen mit Polaris über 200 Neuerungen umfassen. Allerdings konkretisierte der Hersteller nicht, was alles aufaddiert wurde. Ungeachtet dessen ist klar, dass AMD zumindest mit dem Vega-10-Chip wieder Marktsegmente anvisiert, die in den vergangenen Jahren vernachlässigt wurden oder durch Vega überhaupt erst erschlossen werden sollen. Als Zeitraum für die Veröffentlichung wurde das erste Halbjahr 2017 genannt.

Laut AMD etwas unter 500 Quadratmillimeter groß

Da AMDs Grafikchef Raja Koduri den Vega-10-Chip bereitwillig für Fotos hochhielt, können wir eine grobe Aussage zur Größe treffen: Die im 14LPP-Verfahren gefertigte GPU dürfte 500 bis 550 mm² aufweisen [Update: AMDs Raja Koduri sagte uns, Vega 10 sei etwas kleiner als 500 mm²]. Damit ist der Grafikchip voluminöser als der Polaris 10 einer Radeon RX 480 (232 mm²), der GP104 einer Geforce GTX 1080 (314 mm²) und der GP102 einer Titan X (471 mm²), aber kompakter als der monströse GP100 einer Tesla P100 (610 mm²). Die werden übrigens alle mit 14LPP-Technik oder 16FF+ gefertigt, sind also vom Prozess-Node her direkt vergleichbar.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)

Die Fläche des Vega 10 können wir übrigens nur deshalb einigermaßen abschätzen, weil der Chip nach dem Fiji der Fury X der zweite von AMD mit High Bandwidth Memory ist. Konkret verwendet AMD zwei HBM2-Stacks, die jeweils per 1.024 Bit breitem Interface angebunden sind und mit 2 GHz takten. Das ergibt eine Datentransferrate von 512 GByte pro Sekunde, also so viel wie bei der Fury X mit vier HBM1-Stacks mit jeweils 1 GHz. AMD spricht beim Vega 10 von einem High Bandwidth Cache (HBC), da die Speicherarchitektur laut Hersteller massiv von bisherigen Implementierungen abweicht.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
Stellenmarkt
  1. Rolls-Royce Power Systems AG, Friedrichshafen
  2. Auswärtiges Amt, Berlin

Mit im Chip sitzt ein Speichercontroller, der High Bandwidth Cache Controller (HBCC) heißt. Er verwaltet den HBM2 und soll laut AMD bis zu 512 TByte als virtuellen Adressraum (49 Bit) nutzen, um weitaus mehr Daten als bisher üblich verarbeiten zu können - per Paging in etwa dem RAM oder einer SSD. Als Beispiel diente eine Demo in Radeon ProRender, einem Path Tracer. Die gezeigte Szene in einem Haus soll 200 GByte verwenden und würde dank des High Bandwidth Cache Controllers mit höherer Bildrate dargestellt als ohne. Denkbar sei es laut AMD, den HBM als exklusiven oder inklusiven Cache zu nutzen und zusätzlich Flash-Speicher oder Storage Class Memory einzubinden, was auf eine weitere Radeon Pro SSG hinweisen könnte.

All die Daten im HBM2 bringen aber nichts, wenn der Vega-10-Chip sie nicht effizient verarbeitet. Daher hat AMD vorne wie hinten Verbesserungen implementiert, etwa bei der wichtigen Geometriestufe.

Front- wie Backend aufgemöbelt 
  1. 1
  2. 2
  3.  


Anzeige
Top-Angebote
  1. 99,99€ (versandkostenfrei)
  2. (u. a. 32 GB 6,98€, 128 GB 23,58€)
  3. 54,99€
  4. 59,99€

ms (Golem.de) 05. Feb 2017

Die GTX 970 ist ein Sonderfall, da NV den L2 eines MCs gestrichen hat, zudem fehlen ihr...

lustiger Lurch 07. Jan 2017

1. 60% mehr Leistung gegenüber der R9 290 2. doppelt VRAM gegenüber der R9 290 3. die...

plutoniumsulfat 06. Jan 2017

Define S?

Schnapsbrenner 06. Jan 2017

Geilo! Vielen Dank für die schnelle Rückmeldung! :)

Ach 06. Jan 2017

Warten wir's ab und hoffen das Beste :], und ich bin mal gespannt ob man auf der CES von...


Folgen Sie uns
       


Cinebench R20 auf Threadripper 2950X ausprobiert

Cinebench R20 soll mit bis zu 256 Threads umgehen können.

Cinebench R20 auf Threadripper 2950X ausprobiert Video aufrufen
Sechs Airpods-Konkurrenten im Test: Apple hat nicht die Längsten
Sechs Airpods-Konkurrenten im Test
Apple hat nicht die Längsten

Nach dem Klangsieger und dem Bedienungssieger haben wir im dritten Test den kabellosen Bluetooth-Hörstöpsel mit der weitaus besten Akkulaufzeit gefunden. Etwas war aber wieder nicht dabei: die perfekten True Wireless In-Ears.
Ein Test von Ingo Pakalski


    Fido-Sticks im Test: Endlich schlechte Passwörter
    Fido-Sticks im Test
    Endlich schlechte Passwörter

    Sicher mit nur einer PIN oder einem schlechten Passwort: Fido-Sticks sollen auf Tastendruck Zwei-Faktor-Authentifizierung oder passwortloses Anmelden ermöglichen. Golem.de hat getestet, ob sie halten, was sie versprechen.
    Ein Test von Moritz Tremmel

    1. E-Mail-Marketing Datenbank mit 800 Millionen E-Mail-Adressen online
    2. Webauthn Standard für passwortloses Anmelden verabschiedet
    3. Studie Passwortmanager hinterlassen Passwörter im Arbeitsspeicher

    Zotac Geforce GTX 1660 Ti im Test: Gute 1440p-Karte für unter 300 Euro
    Zotac Geforce GTX 1660 Ti im Test
    Gute 1440p-Karte für unter 300 Euro

    Die Geforce GTX 1660 Ti von Zotac ist eine der günstigen Grafikkarten mit Nvidias Turing-Architektur, dennoch erhalten Käufer ein empfehlenswertes Modell: Der leise Pixelbeschleuniger rechnet praktisch so flott wie übertaktete Modelle, braucht aber weniger Energie.
    Ein Test von Marc Sauter

    1. Turing-Grafikkarten Nvidias Geforce 1660/1650 erscheint im März
    2. Grafikkarte Chip der Geforce GTX 1660 Ti ist überraschend groß
    3. Deep Learning Supersampling Nvidia will DLSS-Kantenglättung verbessern

      •  /