Original-URL des Artikels: https://www.golem.de/news/pascal-rechenbeschleuniger-nvidia-veroeffentlicht-drei-varianten-der-tesla-p100-1606-121612.html    Veröffentlicht: 20.06.2016 08:00    Kurz-URL: https://glm.io/121612

Pascal-Rechenbeschleuniger

Nvidia veröffentlicht drei Varianten der Tesla P100

Ein Modell mit NV-Link für IBMs Power8+ und Power9-Chips und zwei klassische PCIe-Steckkarten: Nvidias Tesla-P100-Rechenbeschleuniger für HPC-Systeme soll im Herbst 2016 ausgeliefert werden.

Nvidia hat drei Modellvarianten der Tesla P100 genannten Beschleunigerkarte für Data-Center und HPC-Systeme wie Supercomputer angekündigt. Vorgestellt wurde die Tesla P100 auf der GPU Technology Conference im März 2016 in San Jose, Kalifornien. Nvidia-Chef Jen-Hsun Huang präsentierte sie während seiner Keynote und erläuterte Details zur verwendeten Technik.

Basis der Tesla P100 bildet der GP100-Grafikchip mit Pascal-Architektur. Verglichen mit dem auf der gleichen Technik basierenden GP104 für die Spieler-Grafikkarten Geforce GTX 1080 und Geforce GTX 1070 fallen einige Unterschiede ins Auge: Da der P100 auf HPC ausgelegt ist, stecken in jedem der sechs Graphics Processor Cluster nur 32 Shader-ALUs, dafür verdoppelte Ressourcen wie der Warp-Scheduler, das Register-File und die interne Bandbreite. Der GP100 kann also viel mehr Daten lokal vorhalten und schneller abarbeiten als der GP104, sodass die Geschwindigkeit pro Recheneinheit und pro Takt steigt.

Für den HPC-Markt hat Nvidia drei Tesla P100 in petto: Die proprietäre SXM2-Variante nutzt vier NV-Link-Interconnects und kann in Systemen mit IBMs Power8+ und Power9 verwendet werden. Ersterer entspricht weitestgehend dem Power8-Chip von 2013, der kommende Power9 wird im August 2016 vorgestellt. Die für Power-Prozessoren gedachte Tesla P100 liefert 5,3 über 10,6 bis 21,2 Teraflops (doppelte, einfache und halbe Genauigkeit).

Die PCIe-3.0-x16-Modelle sind per 1,3 statt 1,48 GHz GPU-Boost auf 4,7 Double- und 9,3 Single- und 18,7 Half-Precision-Teraflops begrenzt. Hintergrund ist die Leistungsaufnahme von 250 statt 300 Watt. Bei allen Varianten nutzt Nvidia schnellen On-Package-Speicher vom Typ High Bandwidth Memory. Beim NV-Link-Modul und einer der beiden PCIe-Tesla sind 16 GByte Speicher via vier HBM2-Stapeln verbaut, die Daten mit 720 GByte pro Sekunde verarbeiten.

Erste Tesla P100 werden in der Schweiz verbaut

Auf der zweiten PCI-Karte schaltet Nvidia einen HBM2-Stack ab, was in 12 GByte und einem 3.072 statt 4.096 Bit breiten Interface resultiert. Die Datenrate sinkt auf 540 GByte pro Sekunde, die Rechenleistung bleibt identisch. Die beiden PCIe-Tesla sollen im vierten Quartal 2016 verfügbar sein, zum Tesla-Modul machte Nvidia keine Angaben. Zu den ersten Systemen, die mit Tesla P100 ausgerüstet werden, zählt der Schweizer Supercomputer Piz Daint.  (ms)


Verwandte Artikel:
Eni HPC4: Italienischer Supercomputer weltweit einer der schnellsten   
(20.01.2018, https://glm.io/132270 )
Pascal-Grafikchip: Benchmarks und Details zum GP100   
(07.04.2016, https://glm.io/120186 )
Hardware-Umfrage: 85 Prozent der Steam-Spieler nutzen eine Geforce   
(05.03.2018, https://glm.io/133142 )
IBM AC922: In Deep Learning schlägt der Power9 die x86-Konkurrenz   
(11.12.2017, https://glm.io/131594 )
Notebook: Lenovo plant Ryzen-Thinkpads und bringt Yoga 730/530   
(26.02.2018, https://glm.io/132985 )

© 1997–2019 Golem.de, https://www.golem.de/