Original-URL des Artikels: https://www.golem.de/news/turing-architektur-nvidias-quadro-rtx-hat-16-teraflops-1808-135980.html    Veröffentlicht: 14.08.2018 01:50    Kurz-URL: https://glm.io/135980

Turing-Architektur

Nvidias Quadro RTX hat 16 Teraflops

Mit der Quadro RTX genannten Grafikkarten-Reihe bringt Nvidia die ersten Modelle basierend auf dem riesigen Turing-Chip mit Funktionseinheiten rein für Raytracing. Die Karten haben bis zu 4.608 Shader-Einheiten und bis zu 48 GByte GDDR6-Videospeicher an einem 384-Bit-Interface.

Nvidia hat die Quadro RTX und die den Workstation-Karten zugrunde liegende Turing-Grafikarchitektur vorgestellt. Die Ankündigung erfolgte auf der Siggraph 2018, einer Fachkonferenz, auf der Nvidia-Chef Jensen Huang in einer Keynote die neue Generation persönlich erläuterte. Wie erwartet hebt der Hersteller die verbesserten Tensor-Cores für Machine Learning und die erstmals vorhandenen Raytracing-Cores hervor. Der Turing-Chip misst sehr große 754 mm² und hat 18,6 Milliarden Transistoren im 12-nm-Verfahren für bis zu 4.608 Shader-Einheiten.

Zur Architektur selbst teilte Nvidia wenig mit, das dürfte der Hersteller in den kommenden Wochen nachholen, dennoch: Turing integriert die von den Volta-Karten wie den Tesla V100 oder der Titan V bekannten Tensor-Cores, die dank fest verdrahteten Matrix-Multiplikationen für Inferencing und Training bei Machine Learning eingesetzt werden können. Sie eignen sich unter anderem für das Denoising von per Raytracing mit geringer Strahlendichte erstellten Bildern, neuerdings beherrschen sie auch Genauigkeiten wie FP16 (125 Teraflops), INT8 (250 Tops) und INT4 (500 Tops).

Parallel zu den überarbeiteten Tensor-Cores verbaute Nvidia neue Raytracing-Cores, zu denen der Hersteller sagte, dass sie Ray-Triangle-Intersection beschleunigten. Dieser Schritt beschreibt die Berechnung, ob und wo ein Strahl ein Dreieck trifft. Das ist relevant für auf einem Polygon-Mesh basierende Grafik wie sie heutzutage primär eingesetzt wird, beispielsweise in Spielen. Der Intersection-Shader ist daher ein wichtiger Teil von DirectX Raytracing, das Microsoft im Sommer 2018 ankündigte. Generell spricht Nvidia von der 25-fachen Raytracing-Performance, die Turing verglichen mit der bisherigen Pascal-Architektur erreichen soll. Als neue Metrik nennt der Hersteller bis zu 10 Giga-Rays pro Sekunde.

Ebenfalls neu sind verbesserte Streaming Multiprocessors (SM), so nennt Nvidia seine Shader-Cluster. Diese sollen die dreifache Geometrie-Leistung von Pascal liefern, allerdings sind die dafür zuständigen Polymorph-Engines zumindest bei Pascal und Volta den SMs vorgelagert. Die gestiegene Geschwindigkeit kommt laut Nvidia unter anderem Virtual-Reality-Anwendungen oder -Spielen zugute. Passend dazu weisen die Quadro RTX auch den Virtual Link auf, eine über USB-C realisierte Schnittstelle für VR-Headsets.

Die Quadro RTX 8000 und die Quadro RTX 6000 haben 4.608 Shader-Einheiten und 576 Tensor-Cores und damit annähernd so viele wie die 5.120 ALUs einer Tesla V100 mit GV100-Chip. Die theoretische Rechenleistung liegt mit 16 Teraflops dank hoher Taktraten sogar ein klein wenig darüber. Nvdia verbaut 48 GByte Videospeicher (Quadro RTX 8000) und 24 GByte Videospeicher (Quadro RTX 6000) an einem 384-Bit-Interface mit 14-Gbps-GDDR6 von Samsung. Das ergibt eine Datentransferrate von 672 GByte pro Sekunde, also weniger als bei einer Tesla V100, aber mehr als bei einer Titan V. Für die Quadro RTX 5000 nutzt Nvidia nur noch 16 GByte GDDR6-Speicher an einem mit 256 Bit schmaleren Interface, hier sind geringere 3.072 Shader und 384 Tensor-Cores vorhanden. Alle Quadro RTX haben den von der Quadro GV100 bekannten NV-Link 2.0, um zwei Karten zu koppeln.

Nvidia spricht von Ende des dritten Quartals 2018 und von Anfang des vierten Quartals als Termin für die Verfügbarkeit - hier unterscheiden sich die vorab zur Verfügung gestellten Dokumente. Die Preise für die neuen Grafikkarten belaufen sich auf 10.000 US-Dollar für die Quadro RTX 8000, auf 6.300 US-Dollar für die Quadro RTX 6000 und auf 2.300 US-Dollar für die Quadro RTX 5000. Zu Geforce-Modellen gab es keine Informationen.  (ms)


Verwandte Artikel:
Quartalszahlen: Nvidias Datacenter-Sparte macht 60 Prozent mehr Umsatz   
(16.11.2018, https://glm.io/137757 )
Star Wars Galaxy's Edge: Acht Quadros lassen den Millenium Falcon abheben   
(30.03.2018, https://glm.io/133606 )
Turing-Grafikkarten: Nvidia will A- und non-A-Chips vereinheitlichen   
(06.05.2019, https://glm.io/141063 )
Geforce GTX 1650 im Test: Sparsam, schlank, speicherarm   
(25.04.2019, https://glm.io/140759 )
Nvidia Turing: Geforce GTX 1650 für Notebooks nutzt TU117-Vollausbau   
(25.04.2019, https://glm.io/140871 )

© 1997–2020 Golem.de, https://www.golem.de/