P40 und P4: Nvidia veröffentlicht ungewöhnliche Tesla-Beschleuniger

Einmal schneller Vollausbau und einmal extrem effizient: Die Tesla P40 und die Tesla P4 sind für Deep Learning gedacht, da Nvidia bei den Beschleunigerkarten eine wichtige Funktion freigeschaltet hat.

Artikel veröffentlicht am ,
Tesla P4 (vorn) und Tesla P40
Tesla P4 (vorn) und Tesla P40 (Bild: Nvidia)

Nvidia-Chef Jen-Hsun Huang hat auf der GPU Technology Conference im chinesischen Peking zwei neue Tesla-Beschleuniger vorgestellt: die Tesla P40 und die Tesla P4, die beide auf der aktuellen Pascal-Grafikarchitektur basieren. Sie sind für Inferencing gedacht, also den Schritt nach dem Training eines neuronalen Netzes, wie es etwa für Bilderkennung verwendet wird.

Stellenmarkt
  1. Projektmanager (m/w/d) Digitale Studiotechnik International
    RSG Group GmbH, Berlin
  2. Automotive Security Analyst (m/w/d)
    Volkswagen AG, Wolfsburg
Detailsuche

Für das vorab erfolgende Training ist eine enorm hohe Rechenleistung bei entsprechender Genauigkeit erforderlich, sie liegt Nvidia zufolge bei mindestens FP16 (Floating Point, Half Precison). Die Maxwell-v2-Generation in Form der Tesla M40 und Tesla M4 beherrscht rein von der Hardware her minimal FP32, was für Deep Learning nicht notwendig ist. Die Tesla P40 und die Tesla P4 hingegen beschleunigen INT8-Operationen (Integer, Quarter Precison) pro Takt und Shader auf die vierfache Geschwindigkeit einer FP32-Operation, was laut Nvidia wiederum für Inferencing ausreichend ist.

  • Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)
  • Training vs. Inferencing (Bild: Nvidia)
  • TensorRT-Bibliotek (Bild: Nvidia)
  • Deepstream SDK (Bild: Nvidia)
Daten der Tesla P4 und Tesla P40 (Bild: Nvidia)

Die Tesla P40 basiert auf dem GP102-Chip, den Nvidia auch für die Titan X und die Quadro P6000 einsetzt. Die neue Beschleunigerkarte nutzt einen Vollausbau mit 3.840 Rechenkernen bei 1.303/1.531 MHz (Basis/Boost) und einem Speichertakt von 3,6 GHz. Die 24 GByte sind mit 384 Bit angeschlossen. Nvidia gibt für die passiv gekühlte Karte eine Verlustleistung von 250 Watt an. Statt GDDR5X wird GDDR5 verwendet, was für INT8 wohl ausreicht.

Spannend ist die Tesla P4 im Low-Profile-Format, denn Nvidia taktet den verbauten GP104-Chip extrem niedrig: Der ist von der Geforce GTX 1080/1070 bekannt und läuft dort samt Boost mit meist 1,7 GHz aufwärts. Die neue Beschleunigerkarte dagegen weist eine Frequenz von sehr niedrigen 810/1.063 MHz auf. Das erklärt auch die TDP von 50 bis 75 Watt je nach eingestelltem Power-Limit. Das macht die Tesla P4 trotz GDDR5 extrem effizient.

Golem Akademie
  1. Data Engineering mit Apache Spark: virtueller Zwei-Tage-Workshop
    , Default Title
  2. Elastic Stack Fundamentals – Elasticsearch, Logstash, Kibana, Beats: virtueller Drei-Tage-Workshop
    26.–28. Oktober 2021, Virtuell
Weitere IT-Trainings

Parallel zur Hardware hat Nvidia die TensorRT-Bibliotek, zuvor als GPU Inference Engine bekannt, und das Deepstream SDK vorgestellt. Erstere soll Entwicklern helfen, trainierte Netze von FP16/FP32 auf INT8 anzupassen und Letzteres ist eine Schnittstelle, um Videos zu analysieren. Die beiden Tesla-Beschleuniger sollen im Oktober und November 2016 erscheinen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Samsung Odyssey Neo G9 im Test
Mini-LED im Ultrawide-Format macht den Unterschied

Samsungs Odyssey Neo G9 ist riesig und durch Mini-LED auch kontraststark. Es gibt derzeit keinen besseren (und teureren) 32:9-Monitor für Gaming.
Ein Test von Oliver Nickel

Samsung Odyssey Neo G9 im Test: Mini-LED im Ultrawide-Format macht den Unterschied
Artikel
  1. Raumfahrt: Frankreich will wiederverwendbare Rakete von Arianespace
    Raumfahrt
    Frankreich will wiederverwendbare Rakete von Arianespace

    Arianespace soll eine kleine wiederverwendbare Rakete entwickeln. Das Konzept kommt zu spät, ist zu klein und wirtschaftlich wie politisch fragwürdig.
    Von Frank Wunderlich-Pfeiffer

  2. S-Klasse mit Level 3: Mercedes darf hochautomatisiert fahren
    S-Klasse mit Level 3
    Mercedes darf hochautomatisiert fahren

    Autonom fahren ist es noch nicht, aber Level 3 darf Mercedes nun 2022 mit dem Drive Pilot in der S-Klasse und im EQS anbieten.

  3. Verkehrssicherheit: Teslas werden zu rollender Spielkonsole und zur Gefahr
    Verkehrssicherheit
    Teslas werden zu rollender Spielkonsole und zur Gefahr

    Nach einem Software-Update können bei laufender Fahrt im Tesla drei Spiele gespielt werden. Die Verkehrssicherheitsbehörde ist entsetzt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • RAM-Module und SSDs von Crucial im Angebot • Acer-Monitore zu Bestpreisen (u. a. 27" FHD 165Hz OC 199€) • Kingston PCIe-SSD 1TB 69,90€ & 2TB 174,90€ • Microsoft Flight Simulator Xbox 29,99€ • Alternate (u. a. Kingston A400 480 GB SSD 37,99€) • Release: Halo Infinite 68,99€ [Werbung]
    •  /