Abo
  • Services:
Anzeige
Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor.
Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor. (Bild: Marc Sauter/Golem.de)

Pascal GP100: Nvidias Grafikchip besteht aus 15 Milliarden Transistoren

Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor.
Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor. (Bild: Marc Sauter/Golem.de)

15,3 Milliarden Transistoren auf 610 mm² Chipfläche im 16FF-Prozess und 3.840 Shader-Einheiten mit 16 GByte HBM2-Speicher: Nvidia hat den GP100-Grafikchip mit Pascal-Technik vorgestellt.

Nvidia-Chef Jen-Hsun Huang hat auf der Keynote der GPU Technology Conference 2016 in San Jose, Kalifornien, den GP100-Grafikchip samt der Tesla-P100-Beschleunigerkarte angekündigt. Die auf der Pascal-Architektur basierende Tesla P100 erreicht eine Geschwindigkeit von 10,6 Teraflops bei einfacher Genauigkeit (FP32), was für Spiele wichtig ist. Die für wissenschaftliche Anwendungen relevante FP64-Performance (doppelte Genauigkeit) gibt Nvidia mit 5,3 Teraflops an - das Verhältnis 2:1 gab es bisher nur bei AMD.

Anzeige

Der GP100-Chip wird im 16FF-Prozess bei der TSMC gefertigt und besteht aus 15 Milliarden Transistoren. Zum Vergleich: Nvidias aktueller GM200 der Titan X integriert 8 Milliarden Transistoren und AMDs Fiji der Fury X 8,9 Milliarden Transistoren. Die Die-Fläche des GP100 gibt Nvidia mit enormen 610 mm² an, was etwas größer als der GM200 (601 mm²) und der Fiji (596 mm²) ist. Der Chip soll sich bereits in der Serienfertigung befinden, was angesichts der Maße erstaunlich ist. Fragen zur Yield-Rate wollte Nvidia nicht beantworten.

  • Nvidia-Chef Jen-Hsun Huang (Foto: Marc Sauter/Golem.de)
  • Jen-Hsun Huang stellt die Tesla P100 vor. (Foto: Marc Sauter/Golem.de)
  • Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)
  • Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Leistungswerte der Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Der Chip wird im 16FF-Prozess hergestellt und nutzt HBM2. (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm des GP100 (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm eines SM eines GP100 (Foto: Marc Sauter/Golem.de)
Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)

Die Basis für den neuen GP100 bilden sechs Graphics Processor Cluster (GPC). Jeder enthält fünf Texture Processor Cluster (TPC) mit zwei Streaming Multiprocessors (SMP) mit 64 Shader- und 40 Textur-Einheiten, was an AMDs GCN erinnert. Insgesamt bietet der Chip ergo 3.840 ALUs und 240 TMUs, der L2-Cache fasst 4 MByte. Hinzu kommen 15,36 MByte an Register-Speicher für schnelle On-Chip-Berechnungen. Das Speicherinterface ist 4.096 Bit breit und nutzt High Bandwidth Memory (HBM2), der mit auf einem Interposer sitzt.

Für die Tesla P100 schaltet Nvidia 3.584 Shader-Einheiten frei und taktet sie mit 1.328 MHz Basis- und 1.480 MHz Boost-Frequenz. Daraus resultieren 21,2 Teraflops bei halber Genauigkeit (FP16). Bei einfacher Genauigkeit (FP32) sind es 10,6 Teraflops und bei doppelter Genauigkeit (FP64) noch 5,3 Teraflops. Nvidia verbaut FP32-Einheiten, die pro Takt zwei FP16-Berechnungen durchführen können, und dedizierte FP64-ALUs. Das 4:2:1-Verhältnis ist untypisch, bisherige Nvidia-Architekturen beherrschen bis zu 3:1 für FP32/FP64. Nicht beschleunigt ist INT8, also Integer mit acht Bit Genauigkeit, was andere Pascal-Chips bei vierfacher FP32-Geschwindigkeit ausführen können (sofern freigeschaltet).

  • Nvidia-Chef Jen-Hsun Huang (Foto: Marc Sauter/Golem.de)
  • Jen-Hsun Huang stellt die Tesla P100 vor. (Foto: Marc Sauter/Golem.de)
  • Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)
  • Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Leistungswerte der Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Der Chip wird im 16FF-Prozess hergestellt und nutzt HBM2. (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm des GP100 (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm eines SM eines GP100 (Foto: Marc Sauter/Golem.de)
Tesla P100 (Foto: Marc Sauter/Golem.de)

Am 4.096-Bit-Interface hängen 16 GByte HBM2 von Samsung. Die vier Stacks liefern eine Datentransfer-Rate von 720 GByte pro Sekunde. Das entspricht rund 1,4 GHz - HBM2 schafft allerdings bis zu 2 GHz. Da die Tesla P100 allerdings keinen GP100-Vollausbau nutzt, ist eine gedrosselte Speichergeschwindigkeit sinnvoll, um die 300 Watt TDP einzuhalten.

Vorerst erhalten Cloud-Plattform-Anbieter Zugriff auf die Tesla-P100-Karten, einzelne Hersteller folgen im ersten Quartal 2017. Ein auf dem GP100 basierendes Geforce-Modell hat Nvidia nicht angekündigt.


eye home zur Startseite
Ach 06. Apr 2016

Das Problem ist heutzutage halt, dass der Speicher zum Nadelöhr wird. 4K, 8K und HDRI...

Golressy 06. Apr 2016

Cloud-Plattform-Anbieter erhalten die Karten nur? Da die meisten Clouds ja auf Linux/Unix...

Prypjat 06. Apr 2016

Das ist ein treffender Vergleich. Viele Online Shops haben die Angabe zum Speicher in den...

anonym 06. Apr 2016

ach deswegen gibts den dgx1 mit 8 tesla p100 die per pcie and 2 xeons angebunden sind...

Poison Nuke 06. Apr 2016

und ob. Für jedes Frame muss der gesamte Speicherinhalt einmal ausgelesen werden. Die...



Anzeige

Stellenmarkt
  1. R&S Cybersecurity ipoque GmbH, Leipzig
  2. SICK AG, Waldkirch bei Freiburg im Breisgau
  3. KWS SAAT SE, Einbeck
  4. Nestlé Deutschland AG, Ebersberg-Weiding


Anzeige
Hardware-Angebote
  1. auf Kameras und Objektive
  2. ab 460,48€
  3. ab 216,74€

Folgen Sie uns
       


  1. Mobilfunk

    Leistungsfähigkeit der 5G-Luftschnittstelle wird überschätzt

  2. Drogenhandel

    Weltweit größter Darknet-Marktplatz Alphabay ausgehoben

  3. Xcom-2-Erweiterung angespielt

    Untote und unbegrenzte Schussfreigabe

  4. Niantic

    Das erste legendäre Monster schlüpft demnächst in Pokémon Go

  5. Bundestrojaner

    BKA will bald Messengerdienste hacken können

  6. IETF

    DNS wird sicher, aber erst später

  7. Dokumentation zum Tor-Netzwerk

    Unaufgeregte Töne inmitten des Geschreis

  8. Patentklage

    Qualcomm will iPhone-Importstopp in Deutschland

  9. Telekom

    Wie viele Bundesfördermittel gehen ins Vectoring?

  10. IETF

    Wie TLS abgehört werden könnte



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Moto Z2 Play im Test: Bessere Kamera entschädigt nicht für kürzere Akkulaufzeit
Moto Z2 Play im Test
Bessere Kamera entschädigt nicht für kürzere Akkulaufzeit
  1. Modulares Smartphone Moto Z2 Play kostet mit Lautsprecher-Mod 520 Euro
  2. Lenovo Hochleistungs-Akku-Mod für Moto Z
  3. Moto Z Schiebetastatur-Mod hat Finanzierungsziel erreicht

Razer Lancehead im Test: Drahtlose Symmetrie mit Laser
Razer Lancehead im Test
Drahtlose Symmetrie mit Laser
  1. Razer Blade Stealth 13,3- statt 12,5-Zoll-Panel im gleichen Gehäuse
  2. Razer Core im Test Grafikbox + Ultrabook = Gaming-System
  3. Razer Lancehead Symmetrische 16.000-dpi-Maus läuft ohne Cloud-Zwang

Ikea Trådfri im Test: Drahtlos (und sicher) auf Schwedisch
Ikea Trådfri im Test
Drahtlos (und sicher) auf Schwedisch
  1. Die Woche im Video Kündigungen, Kernaussagen und KI-Fahrer
  2. Augmented Reality Ikea will mit iOS 11 Wohnungen virtuell einrichten
  3. Space10 Ikea-Forschungslab untersucht Umgang mit KI

  1. Re: In einen Porsche gehört ein luftgekühlter Boxer

    kommentar4711 | 20:34

  2. Re: warum ist sofortueberweisung überhaupt am Markt?

    My1 | 20:32

  3. Re: Der Telekom ist das egal

    RipClaw | 20:29

  4. Da bin ich mal skeptisch.

    Koto | 20:28

  5. Re: Jackpot

    neokawasaki | 20:27


  1. 19:00

  2. 18:52

  3. 18:38

  4. 18:30

  5. 17:31

  6. 17:19

  7. 16:34

  8. 15:44


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel