Abo
  • Services:

P40 und P4: Nvidia veröffentlicht ungewöhnliche Tesla-Beschleuniger

Einmal schneller Vollausbau und einmal extrem effizient: Die Tesla P40 und die Tesla P4 sind für Deep Learning gedacht, da Nvidia bei den Beschleunigerkarten eine wichtige Funktion freigeschaltet hat.

Artikel veröffentlicht am ,
Tesla P4 (vorn) und Tesla P40
Tesla P4 (vorn) und Tesla P40 (Bild: Nvidia)

Nvidia-Chef Jen-Hsun Huang hat auf der GPU Technology Conference im chinesischen Peking zwei neue Tesla-Beschleuniger vorgestellt: die Tesla P40 und die Tesla P4, die beide auf der aktuellen Pascal-Grafikarchitektur basieren. Sie sind für Inferencing gedacht, also den Schritt nach dem Training eines neuronalen Netzes, wie es etwa für Bilderkennung verwendet wird.

Stellenmarkt
  1. Baker Tilly, Düsseldorf
  2. FES Frankfurter Entsorgungs- und Service GmbH, Frankfurt am Main

Für das vorab erfolgende Training ist eine enorm hohe Rechenleistung bei entsprechender Genauigkeit erforderlich, sie liegt Nvidia zufolge bei mindestens FP16 (Floating Point, Half Precison). Die Maxwell-v2-Generation in Form der Tesla M40 und Tesla M4 beherrscht rein von der Hardware her minimal FP32, was für Deep Learning nicht notwendig ist. Die Tesla P40 und die Tesla P4 hingegen beschleunigen INT8-Operationen (Integer, Quarter Precison) pro Takt und Shader auf die vierfache Geschwindigkeit einer FP32-Operation, was laut Nvidia wiederum für Inferencing ausreichend ist.

  • Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)
  • Training vs. Inferencing (Bild: Nvidia)
  • TensorRT-Bibliotek (Bild: Nvidia)
  • Deepstream SDK (Bild: Nvidia)
Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)

Die Tesla P40 basiert auf dem GP102-Chip, den Nvidia auch für die Titan X und die Quadro P6000 einsetzt. Die neue Beschleunigerkarte nutzt einen Vollausbau mit 3.840 Rechenkernen bei 1.303/1.531 MHz (Basis/Boost) und einem Speichertakt von 3,6 GHz. Die 24 GByte sind mit 384 Bit angeschlossen. Nvidia gibt für die passiv gekühlte Karte eine Verlustleistung von 250 Watt an. Statt GDDR5X wird GDDR5 verwendet, was für INT8 wohl ausreicht.

Spannend ist die Tesla P4 im Low-Profile-Format, denn Nvidia taktet den verbauten GP104-Chip extrem niedrig: Der ist von der Geforce GTX 1080/1070 bekannt und läuft dort samt Boost mit meist 1,7 GHz aufwärts. Die neue Beschleunigerkarte dagegen weist eine Frequenz von sehr niedrigen 810/1.063 MHz auf. Das erklärt auch die TDP von 50 bis 75 Watt je nach eingestelltem Power-Limit. Das macht die Tesla P4 trotz GDDR5 extrem effizient.

Parallel zur Hardware hat Nvidia die TensorRT-Bibliotek, zuvor als GPU Inference Engine bekannt, und das Deepstream SDK vorgestellt. Erstere soll Entwicklern helfen, trainierte Netze von FP16/FP32 auf INT8 anzupassen und Letzteres ist eine Schnittstelle, um Videos zu analysieren. Die beiden Tesla-Beschleuniger sollen im Oktober und November 2016 erscheinen.



Anzeige
Top-Angebote
  1. 264,00€
  2. ab 479€
  3. ab 219,00€ im PCGH-Preisvergleich
  4. Für 150€ kaufen und 75€ sparen

nille02 15. Sep 2016

Streiche einfach das T.

Smincke 15. Sep 2016

Ich glaube es wird einfach ein viertel Integer gemeint sein also 8Bit. Die Precision...

H4ndy 15. Sep 2016

Das ist halt das Problem, je näher man an die Perfektion will, um so schneller steigt der...


Folgen Sie uns
       


Amazons Echo Plus (2018) - Test

Der neue Echo Plus von Amazon liefert einen deutlich besseren Klang als alle bisherigen Echo-Lautsprecher. Praktisch ist außerdem der eingebaute Smart-Home-Hub. Der integrierte Temperatursensor muss aber noch bessser in Alexa integriert werden. Der neue Echo Plus ist zusammen mit einer Hue-Lampe von Philips für 150 Euro zu haben.

Amazons Echo Plus (2018) - Test Video aufrufen
Augmented Reality: Das AR-Fabrikgelände aus dem Smartphone
Augmented Reality
Das AR-Fabrikgelände aus dem Smartphone

Derzeit ist viel von einer Augmented Reality Cloud die Rede. Golem.de hat mit dem Berliner Startup Visualix über den Stand der Technik und künftige Projekte für Unternehmenskunden gesprochen - und darüber, was die Neuerungen für Pokémon Go bedeuten könnten.
Ein Interview von Achim Fehrenbach

  1. Jarvish Motorradhelm bringt Alexa in den Kopf
  2. Patentantrag Apple plant Augmented-Reality in der Windschutzscheibe
  3. Magic Leap Lumin OS Erste Bilder des Betriebssystems für Augmented Reality

Galaxy A9 im Hands on: Samsung bietet vier
Galaxy A9 im Hands on
Samsung bietet vier

Samsung erhöht die Anzahl der Kameras bei seinen Smartphones weiter: Das Galaxy A9 hat derer vier, zudem ist auch die restliche Ausstattung nicht schlecht. Aus verkaufspsychologischer Sicht könnte die Einstufung in die A-Mittelklasse bei einem Preis von 600 Euro ein Problem sein.
Ein Hands on von Tobias Költzsch

  1. Auftragsfertiger Samsung startet 7LPP-Herstellung mit EUV
  2. Galaxy A9 Samsung stellt Smartphone mit vier Hauptkameras vor
  3. Galaxy J4+ und J6+ Samsung stellt neue Smartphones im Einsteigerbereich vor

Mate 20 Pro im Hands on: Huawei bringt drei Brennweiten und mehr für 1.000 Euro
Mate 20 Pro im Hands on
Huawei bringt drei Brennweiten und mehr für 1.000 Euro

Huawei hat mit dem Mate 20 Pro seine Dreifachkamera überarbeitet: Der monochrome Sensor ist einer Ultraweitwinkelkamera gewichen. Gleichzeitig bietet das Smartphone zahlreiche technische Extras wie einen Fingerabdrucksensor unter dem Display und einen sehr leistungsfähigen Schnelllader.
Ein Hands on von Tobias Költzsch

  1. Keine Spionagepanik Regierung wird chinesische 5G-Ausrüster nicht ausschließen
  2. Watch GT Huawei bringt Smartwatch ohne Wear OS auf den Markt
  3. Ascend 910/310 Huaweis AI-Chips sollen Google und Nvidia schlagen

    •  /