Abo
  • Services:
Anzeige
Raja Koduri zeigt den Vega-10-Chip.
Raja Koduri zeigt den Vega-10-Chip. (Bild: Marc Sauter/Golem.de)

Front- wie Backend aufgemöbelt

Laut AMD erreicht die Vega-Architektur mehr als den doppelten Geometriedurchsatz von Polaris. Das ist erstaunlich, da hier schon der neue Primitive Discard Accelerator genutzt wird, der verdeckte Dreiecke verwirft, die kleiner als ein Pixel sind, und so die Berechnung beschleunigt. AMD gibt an, dass Vega wie auch Fiji (Fury X) über vier Geometry-Engines verfügen, aber pro Takt elf statt vier Polygone durchschleusen kann. Der Geometriedurchsatz wird ergo theoretisch mehr als verdoppelt.

Anzeige
  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)

Bei Vega existiert im Frontend ein Workgroup-Distributor, der feinkörnig die Geometry-, die Compute- und die Pixel-Engines ansteuern soll. Er kann die für Tessellation notwendigen Patches über mehrere Compute Units hinweg berechnen, was in Szenen mit vielen kleinen Objekten einen drastischen Geschwindigkeitsschub bei der Geometrie-Berechnung bedeutet. Neu ist obendrein eine Pipeline-Stufe für sogenannte Primitive Shader, bei denen Vertex- und Geometry-Shader über eine API-Erweiterung zusammengefasst werden.

Als weitere Neuerung nennt AMD die NCUs, die Next Generation Compute Units. Darunter versteht der Hersteller die Ausführungsblöcke, welche unter anderem die Shader-Rechenkerne enthalten. Die sollen deutlich höher taktbar sein als bei Polaris und beherrschen mehr Durchsatz bei halber (FP16) sowie einem Viertel Genauigkeit (INT8), was beides für Inferencing relevant ist. Pro Takt und Compute Unit, die eventuell 128 statt 64 ALUs umfasst, schafft Vega somit 512 INT8-OPS, 256 FP16-FLOPS und 128 FP32-FLOPS. Die Leistung bei der für wissenschaftliche Berechnungen wichtigen doppelten Genauigkeit (FP64) ist konfigurierbar, das SP:DP-Verhältnis nannte AMD nicht.

Neue ROPs für moderne Engines

Obendrein kommt ein sogenannter Draw Stream Binning Rasterizer, der die Daten in Kacheln (Tiles) zerlegt, die in einem Cache (Binn) lokal gespeichert werden. Das soll schneller und effizienter sein als bisher, da so Bandbreite gespart wird. Auch Nvidia verwendet seit Maxwell einen Tiled-Cache- statt einen Immediate-Renderer. Die überarbeiten, nun den L2-Caches statt dem Speichercontroller untergeordneten Raster-Endstufen (ROPs) im Backend beschleunigen laut AMD vor allem Spiele mit Deferred Rendering. Zwar arbeiten einige Studios und Engines mit Forward+ Shading, was je nach Anzahl der Lichtquellen oder der Art der Kantenglättung bessere Resultate erzielt. Deferred Rendering ist aber weitaus verbreiteter. Alle Bestandteile von Vega 10 werden durch das neue Infinity Fabric verknüpft, im Falle der GPU in einer Art Mesh-Struktur.

Die theoretische Rechenleistung von Vega 10 beträgt mindestens 12,5 Teraflops bei einfacher Genauigkeit, denn die erreicht schon die Radeon Instinct MI25. Da der Chip vermutlich über 4.096 Shader-Einheiten verfügt, würde das einem Takt von 1,525 GHz entsprechen. Consumer-Karten dürften erfahrungsgemäß schneller sein.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)

Auf einem Vega-10-System mit einem frühen Prototyp (übrigens in einem völlig zugeklebten Gehäuse) lief wie eingangs erwähnt Doom mit Ultra-Details unter Vulkan in 3.840 x 2.160 Pixeln. Wir haben die erweiterte Performance-Anzeige eingeschaltet und uns die Details angeschaut: Die Karte erreicht knapp 70 fps, das entspricht etwas weniger als dem Doppelten einer Radeon RX 480 und wäre flotter als eine übertaktete Geforce GTX 1080. Wie schnell finale Karten mit Vega 10 werden, lässt sich dadurch zwar nicht sagen - aber zumindest grob einordnen. Bis zum Release dürften etwa die Treiber noch diverse Optimierungen erhalten und die Karte mehr Frischluft erhalten als im Demo-Aufbau, was höhere Taktraten erlauben sollte.

Zumindest der Prototyp nutzte 8 GByte Videospeicher, das Endprodukt soll 16 und 32 GByte verwenden. Zusammen mit der Rohleistung und den vielen Verbesserungen könnte Vega 10 damit in Schlagdistanz von Nvidias Oberklassemodellen im Consumer- wie Profisegment kommen.

Hinweis: Golem.de hat auf Einladung von AMD den Tech Summit im Dezember 2016 im kalifornischen Sonoma besucht.

 Grafikchip: AMD zeigt Vega 10 und erläutert Architektur

eye home zur Startseite
ms (Golem.de) 05. Feb 2017

Die GTX 970 ist ein Sonderfall, da NV den L2 eines MCs gestrichen hat, zudem fehlen ihr...

lustiger Lurch 07. Jan 2017

1. 60% mehr Leistung gegenüber der R9 290 2. doppelt VRAM gegenüber der R9 290 3. die...

plutoniumsulfat 06. Jan 2017

Define S?

Schnapsbrenner 06. Jan 2017

Geilo! Vielen Dank für die schnelle Rückmeldung! :)

Ach 06. Jan 2017

Warten wir's ab und hoffen das Beste :], und ich bin mal gespannt ob man auf der CES von...



Anzeige

Stellenmarkt
  1. DewertOkin GmbH, Hamburg
  2. ifb KG, Seehausen am Staffelsee
  3. Robert Bosch GmbH, Ludwigsburg
  4. BG-Phoenics GmbH, München


Anzeige
Spiele-Angebote
  1. 79,98€ + 5€ Rabatt (Vorbesteller-Preisgarantie)
  2. 199€
  3. (u. a. BioShock: The Collection 16,99€, Borderlands 2 GOTY 7,99€, Civilization VI 35,99€ und...

Folgen Sie uns
       


  1. R-PHY- und R-MACPHY

    Kabelnetzbetreiber müssen sich nicht mehr festlegen

  2. ePrivacy-Verordnung

    Ausschuss votiert für Tracking-Schutz und Verschlüsselung

  3. Lifetab X10605 und X10607

    LTE-Tablets direkt bei Medion bestellen

  4. Gran Turismo Sport im Test

    Puristischer Fahrspaß - fast nur für Onlineraser

  5. Breitbandausbau

    Oettinger bedauert Privatisierung der Telekom

  6. Elektroauto

    Tesla Model S brennt auf österreichischer Autobahn aus

  7. Ubuntu 17.10 im Test

    Unity ist tot, lange lebe Unity!

  8. Asus Rog GL503 und GL703

    Auf 15 und 17 Zoll für vergleichsweise wenig Geld spielen

  9. Swisscom

    Einsatz von NG.fast bringt bis zu 5 GBit/s

  10. Bixby 2.0

    Samsung will Sprachassistenten auf viel mehr Geräte bringen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Xperia Touch im Test: Sonys coolem Android-Projektor fehlt das Killerfeature
Xperia Touch im Test
Sonys coolem Android-Projektor fehlt das Killerfeature
  1. Roboter Sony lässt Aibo als Alexa-Konkurrenten wieder auferstehen
  2. Sony Xperia XZ1 Compact im Test Alternativlos für Freunde kleiner Smartphones
  3. Sony Xperia XZ1 und XZ1 Compact sind erhältlich

Arktika 1 im Test: Monster-verseuchte Eiszeitschönheit
Arktika 1 im Test
Monster-verseuchte Eiszeitschönheit
  1. TPCast Oculus Rift erhält Funkmodul
  2. Oculus Go Alleine lauffähiges VR-Headset für 200 US-Dollar vorgestellt
  3. Virtual Reality Update bindet Steam-Rift in Oculus Home ein

ZFS ausprobiert: Ein Dateisystem fürs Rechenzentrum im privaten Einsatz
ZFS ausprobiert
Ein Dateisystem fürs Rechenzentrum im privaten Einsatz
  1. Librem 5 Purism zeigt Funktionsprototyp für freies Linux-Smartphone
  2. Pipewire Fedora bekommt neues Multimedia-Framework
  3. Linux-Desktops Gnome 3.26 räumt die Systemeinstellungen auf

  1. Re: Braucht die Welt nicht...

    berritorre | 16:43

  2. Re: Ist das relevant? Wir haben jedes Jahr 15000...

    gadthrawn | 16:40

  3. Swarm Computing Status: x

    lukasdurmich | 16:40

  4. Re: Sollten lieber den Desktop komplett an MacOS...

    TTX | 16:38

  5. Re: Nur über USB?

    Boogieman | 16:38


  1. 15:42

  2. 15:27

  3. 15:12

  4. 15:00

  5. 13:49

  6. 12:25

  7. 12:00

  8. 11:56


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel