Abo
  • Services:
Anzeige
Tesla P4 (vorn) und Tesla P40
Tesla P4 (vorn) und Tesla P40 (Bild: Nvidia)

P40 und P4: Nvidia veröffentlicht ungewöhnliche Tesla-Beschleuniger

Tesla P4 (vorn) und Tesla P40
Tesla P4 (vorn) und Tesla P40 (Bild: Nvidia)

Einmal schneller Vollausbau und einmal extrem effizient: Die Tesla P40 und die Tesla P4 sind für Deep Learning gedacht, da Nvidia bei den Beschleunigerkarten eine wichtige Funktion freigeschaltet hat.

Nvidia-Chef Jen-Hsun Huang hat auf der GPU Technology Conference im chinesischen Peking zwei neue Tesla-Beschleuniger vorgestellt: die Tesla P40 und die Tesla P4, die beide auf der aktuellen Pascal-Grafikarchitektur basieren. Sie sind für Inferencing gedacht, also den Schritt nach dem Training eines neuronalen Netzes, wie es etwa für Bilderkennung verwendet wird.

Anzeige

Für das vorab erfolgende Training ist eine enorm hohe Rechenleistung bei entsprechender Genauigkeit erforderlich, sie liegt Nvidia zufolge bei mindestens FP16 (Floating Point, Half Precison). Die Maxwell-v2-Generation in Form der Tesla M40 und Tesla M4 beherrscht rein von der Hardware her minimal FP32, was für Deep Learning nicht notwendig ist. Die Tesla P40 und die Tesla P4 hingegen beschleunigen INT8-Operationen (Integer, Quarter Precison) pro Takt und Shader auf die vierfache Geschwindigkeit einer FP32-Operation, was laut Nvidia wiederum für Inferencing ausreichend ist.

  • Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)
  • Training vs. Inferencing (Bild: Nvidia)
  • TensorRT-Bibliotek (Bild: Nvidia)
  • Deepstream SDK (Bild: Nvidia)
Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)

Die Tesla P40 basiert auf dem GP102-Chip, den Nvidia auch für die Titan X und die Quadro P6000 einsetzt. Die neue Beschleunigerkarte nutzt einen Vollausbau mit 3.840 Rechenkernen bei 1.303/1.531 MHz (Basis/Boost) und einem Speichertakt von 3,6 GHz. Die 24 GByte sind mit 384 Bit angeschlossen. Nvidia gibt für die passiv gekühlte Karte eine Verlustleistung von 250 Watt an. Statt GDDR5X wird GDDR5 verwendet, was für INT8 wohl ausreicht.

Spannend ist die Tesla P4 im Low-Profile-Format, denn Nvidia taktet den verbauten GP104-Chip extrem niedrig: Der ist von der Geforce GTX 1080/1070 bekannt und läuft dort samt Boost mit meist 1,7 GHz aufwärts. Die neue Beschleunigerkarte dagegen weist eine Frequenz von sehr niedrigen 810/1.063 MHz auf. Das erklärt auch die TDP von 50 bis 75 Watt je nach eingestelltem Power-Limit. Das macht die Tesla P4 trotz GDDR5 extrem effizient.

Parallel zur Hardware hat Nvidia die TensorRT-Bibliotek, zuvor als GPU Inference Engine bekannt, und das Deepstream SDK vorgestellt. Erstere soll Entwicklern helfen, trainierte Netze von FP16/FP32 auf INT8 anzupassen und Letzteres ist eine Schnittstelle, um Videos zu analysieren. Die beiden Tesla-Beschleuniger sollen im Oktober und November 2016 erscheinen.


eye home zur Startseite
nille02 15. Sep 2016

Streiche einfach das T.

Smincke 15. Sep 2016

Ich glaube es wird einfach ein viertel Integer gemeint sein also 8Bit. Die Precision...

H4ndy 15. Sep 2016

Das ist halt das Problem, je näher man an die Perfektion will, um so schneller steigt der...



Anzeige

Stellenmarkt
  1. SKF GmbH, Schweinfurt
  2. ALPLA Werke Alwin Lehner GmbH & Co KG, Hard (Österreich)
  3. Deutsche Gesetzliche Unfallversicherung e.V., Sankt Augustin
  4. SICK AG, Reute bei Freiburg im Breisgau


Anzeige
Top-Angebote
  1. Boomster 279,99€, Consono 35 MK3 5.1-Set 333,00€, Move BT 119,99€)
  2. 69,99€ (Liefertermin unbekannt)
  3. (heute u. a. mit 40% auf Polar A360, Sony DSC-RX10M2 für 999,00€)

Folgen Sie uns
       


  1. Smartphones

    iOS legt weltweit zu - außer in China und Deutschland

  2. Glasfaser

    Ewe steckt 1 Milliarde Euro in Fiber To The Home

  3. Nanotechnologie

    Mit Nanokristallen im Dunkeln sehen

  4. Angriff auf Verlinkung

    LG Hamburg fordert Prüfpflicht für kommerzielle Webseiten

  5. Managed-Exchange-Dienst

    Telekom-Cloud-Kunde konnte fremde Adressbücher einsehen

  6. Rockstar Games

    Spieleklassiker Bully für Mobile-Geräte erhältlich

  7. Crimson Relive Grafiktreiber

    AMD lässt seine Radeon-Karten chillen und streamen

  8. Layout Engine

    Facebook portiert CSS-Flexbox für native Apps

  9. Creators Update für Windows 10

    Microsoft wird neue Sicherheitsfunktionen bieten

  10. Landgericht Traunstein

    Postfach im Impressum einer Webseite nicht ausreichend



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Google, Apple und Mailaccounts: Zwei-Faktor-Authentifizierung richtig nutzen
Google, Apple und Mailaccounts
Zwei-Faktor-Authentifizierung richtig nutzen
  1. Bugs in Encase Mit dem Forensik-Tool die Polizei hacken
  2. Red Star OS Sicherheitslücke in Nordkoreas Staats-Linux
  3. 0-Day Tor und Firefox patchen ausgenutzten Javascript-Exploit

Steep im Test: Frei und einsam beim Bergsport
Steep im Test
Frei und einsam beim Bergsport
  1. PES 2017 Update mit Stadion und Hymnen von Borussia Dortmund
  2. Motorsport Manager im Kurztest Neustart für Sportmanager
  3. NBA 2K17 10.000 Schritte für Ingame-Boost

Kosmobits im Test: Tausch den Spielecontroller gegen einen Mikrocontroller!
Kosmobits im Test
Tausch den Spielecontroller gegen einen Mikrocontroller!
  1. HiFive 1 Entwicklerboard mit freiem RISC-Prozessor verfügbar
  2. Simatic IoT2020 Siemens stellt linuxfähigen Arduino-Klon vor
  3. Calliope Mini Mikrocontroller-Board für deutsche Schüler angekündigt

  1. Re: Was aufrüsten für WoW?

    Natz | 21:01

  2. Re: DSL-Community

    Ovaron | 20:59

  3. Re: Ja ist denn heut schon Weihnachten?

    teenriot* | 20:56

  4. Re: Die erste kurze Demo sieht ja schon mal gut aus

    Sybok | 20:55

  5. Re: Linux + Wine?

    ManMashine | 20:53


  1. 18:02

  2. 16:46

  3. 16:39

  4. 16:14

  5. 15:40

  6. 15:04

  7. 15:00

  8. 14:04


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel