Tesla P100 & P40: Microsoft nutzt Pascal-GPUs für Azure

Wer seine künstliche Intelligenz optimieren oder in Echtzeit Sprache übersetzen möchte, der hat bei Microsofts Azure-Cloud neue Tesla-Optionen mit Nvidias Pascal-Technik: Die P100 eignen sich für Training, die P40 auch für Inferencing.

Artikel veröffentlicht am ,
Tesla P100 in der NV-Link-Variante
Tesla P100 in der NV-Link-Variante (Bild: Nvidia)

Microsoft bietet für die Azure-Cloud-Plattform bald zwei neue Instanzen in verschiedenen Ausbaustufen an: Die virtuellen Maschinen der Reihe NC_v2 basieren auf bis zu vier Tesla P100 von Nvidia, die ND-Familie auf bis zu vier Tesla P40. Beide ersetzen die bisherige Serie NC_v1 mit bis zu vier Tesla K80, liefern aber weitaus mehr Flexibilität und Geschwindigkeit.

  • Stand der Dinge bei Azure (Foto: Marc Sauter/Golem.de)
  • Die bisherige NC-Instanz (Foto: Marc Sauter/Golem.de)
  • Die NC_v2-Instanz nutzt Tesla P100. (Foto: Marc Sauter/Golem.de)
  • Vergleich von NC und NC_v2 (Foto: Marc Sauter/Golem.de)
  • ND beschreibt Instanzen mit Tesla P40.  (Foto: Marc Sauter/Golem.de)
  • Vergleich von NC und ND beim Training (Foto: Marc Sauter/Golem.de)
  • Vergleich von NC und ND beim Inferencing (Foto: Marc Sauter/Golem.de)
Die NC_v2-Instanz nutzt Tesla P100. (Foto: Marc Sauter/Golem.de)
Stellenmarkt
  1. Junior-Inhouse-Consultant (m/w/d)
    MVV Energie AG, Mannheim
  2. Project Manager & Product Owner MES (m/w/d)
    Dr. August Oetker Nahrungsmittel KG, Bielefeld
Detailsuche

Die NC_v2-Instanzen eignen sich für HPC (High Performance Computing) wie seismische Berechnungen, DNA-Sequenzierung oder Effekte für Filme. Die Tesla P100 weisen hierzu rund 9,3 Teraflops pro Beschleuniger bei einfacher und 4,7 Teraflops bei doppelter Genauigkeit auf. Zwar unterstützen sie auch Half Precision (FP16) mit 18,6 Teraflops - das würden aber nur wenige Kunden nachfragen. Verglichen mit den bisherigen NC-Systemen mit Tesla K80 steigt die Leistung in HPC-Benchmarks teils um das Dreifache. Die NC_v2 sind mit bis zu 24 CPU-Kernen, 448 GByte und 3 TByte Flash-Speicher verfügbar.

Tesla P40 für Inferencing

Für das Training von künstlicher Intelligenz oder das Inferencing bei Deep Learning sind die ND-Instanzen mit Tesla P40 gedacht. Ihnen fehlt beschleunigtes FP16, dafür erreicht eine Karte bereits knapp 12 Teraflops bei Single Precision. Außerdem beherrschen sie bei INT8 die vierfache Geschwindigkeit, was sie für Inferencing interessant macht. FPGAs seien oft schneller, bisher bietet Microsoft die aber nicht in der Azure-Cloud an.

Bei Workloads mit Caffe oder dem Cognitive Toolkit (CNTK) seien vier Tesla P40 mehr als doppelt so flott wie vier Tesla K80. Bei Inferencing statt Training fällt der Leistungszuwachs noch drastischer aus: Microsoft spricht von Faktor 21, wenn das Tensor-RT-Framework und viele Bilder verwendet werden.

Golem Akademie
  1. Netzwerktechnik Kompaktkurs: virtueller Fünf-Tage-Workshop
    6.–10. Dezember 2021, virtuell
  2. CEH Certified Ethical Hacker v11: virtueller Fünf-Tage-Workshop
    10.–14. Januar 2022, Virtuell
Weitere IT-Trainings

Die neuen Instanzen sollen als Vorschauversion in den kommenden Monaten verfügbar sein, interessierte Kunden können sich anmelden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Raumfahrt
Rocketlab entwickelt eine bessere Rakete als die Falcon 9

Rocketlab zeigt eine moderne wiederverwendbare Rakete, die trotz einer teilweise fragwürdigen Präsentation sehr ernst genommen werden muss.
Eine Analyse von Frank Wunderlich-Pfeiffer

Raumfahrt: Rocketlab entwickelt eine bessere Rakete als die Falcon 9
Artikel
  1. Ikea Åskväder: Modulare Steckdosenleiste startet in Deutschland
    Ikea Åskväder
    Modulare Steckdosenleiste startet in Deutschland

    Die modulare Steckdosenleiste von Ikea ermöglicht viele Anpassungsmöglichkeiten und wird erstmals auf der Ikea-Webseite gelistet.

  2. Fire TV und Android TV: Streaminggeräte in diesem Jahr gefragter
    Fire TV und Android TV
    Streaminggeräte in diesem Jahr gefragter

    Obwohl immer mehr Haushalte bereits Smart-TVs besitzen, ist die Nachfrage nach externen Streaminglösungen wie dem Fire TV stark gestiegen.

  3. Feldversuch E-Mobility-Chaussee: So schnell bringen E-Autos das Stromnetz ans Limit
    Feldversuch E-Mobility-Chaussee
    So schnell bringen E-Autos das Stromnetz ans Limit

    Das Laden von Elektroautos stellt Netzbetreiber auf dem Land vor besondere Herausforderungen. Ein Pilotprojekt hat verschiedene Lösungen getestet.
    Ein Bericht von Friedhelm Greis

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Advent: Toshiba Canvio 6TB 88€ • Netgear günstiger (u. a. 5-Port-Switch 16,89€) • Norton 360 Deluxe 2022 18,99€ • Gaming-Monitore zu Bestpreisen (u. a. Samsung G3 27" FHD 144Hz 219€) • Spiele günstiger: PC, PS5, Xbox, Switch • Gaming-Stühle zu Bestpreisen [Werbung]
    •  /