AWS P3: Amazon packt Nvidias Volta in die Cloud

Wer Machine Learning oder HPC mit den Amazon Web Services nutzen will, bekommt mit den P3-Instanzen drastisch mehr Leistung: Amazon hat diese mit Nvidias Tesla-V100-Beschleunigern für bis zu einem Petaflop an FP16-Geschwindigkeit ausgestattet.

Artikel veröffentlicht am ,
Tesla V100 im SXM2-Formfaktor
Tesla V100 im SXM2-Formfaktor (Bild: Marc Sauter/Golem.de)

Amazon hat eine Erweiterung für die Elastic Compute Cloud (EC2) der Amazon Web Services vorgestellt: Die P3-Instanzen sind für Nutzer gedacht, die auf höchstmögliche Leistung zugreifen möchten. Amazon zufolge sind sie unter anderem für Machine Learning - Training wie Inferencing - oder allgemein für High Performance Computing (HPC) ausgelegt. Verglichen mit den bisherigen P2-Instanzen explodiert die verfügbare Rechenkapazität, da Amazon von Kepler-basierten Nvidia-Beschleunigern auf Volta-Modelle wechselt.

Stellenmarkt
  1. Verwaltungsfachangestellter (m/w/d) im Bereich Jugendwesen
    ekom21 - KGRZ Hessen, Gießen, Kassel, Fulda
  2. Head of R&D - Gesamtentwicklungsleiter Hard- & Software (d/m/w)
    R2 Consulting GmbH, Ruhrgebiet
Detailsuche

Bei den P2-Instanzen von vergangenem Jahr kommen noch alte Tesla K80 auf Dual-Sockel-Boards mit zwei Xeon E5-2686 v4 (Broadwell-EP) mit 16C/32T und bis zu 732 GByte DDR4-Arbeitsspeicher zum Einsatz. Die neuen P3-Instanzen hingegen sind mit Tesla V100 ausgestattet, wenngleich weiterhin mit Xeon E5 und maximal 488 GByte RAM. Hintergrund ist der SXM2-Formfaktor der Tesla-Module, die mehr Platz benötigen als PCIe-Karten. Deshalb gibt es zwar nur 8 statt 16 davon, dafür können die Tesla V100 per proprietärer NV-Link-2.0-Verbindung besonders schnell untereinander kommunizieren.

Die Rechenleistung bei doppelter Genauigkeit (FP64) steigt im Vollausbau von 23 auf 62 Teraflops und bei einfacher Genauigkeit (FP32) von 70 auf 125 Teraflops. Die neuen P3-Instanzen beherrschen aufgrund der Tesla V100 zudem sogenannte Mixed Precision (FP16) in Form ihrer speziellen Tensor-Cores, weshalb hier 960 Teraflops per Matrix-Multiplikation erreicht werden.

Abseits der P3-Instanzen bietet Amazon auch F1-Instanzen mit FPGAs an, die sich für Bild- und Videobearbeitung oder Deep Learning eignen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
El-Ali-Meteorit
Forscher entdecken zwei neue Minerale in einem Meteoriten

In einer Probe aus einem in Somalia niedergegangenen Meteoriten wurden zwei Mineralien entdeckt, die auf der Erde so bisher nicht gefunden wurden.

El-Ali-Meteorit: Forscher entdecken zwei neue Minerale in einem Meteoriten
Artikel
  1. Kraftfahrt-Bundesamt: Elektrischer Corsa sollte zur Abgasuntersuchung
    Kraftfahrt-Bundesamt
    Elektrischer Corsa sollte zur Abgasuntersuchung

    Das Kraftfahrt-Bundesamt ruft den Opel Corsa samt der Elektro-Variante zurück, weil ein Softwarefehler im Auto eine Messung verhindert.

  2. Recruiting: Personalauswahl mit KI kann Unternehmen schaden
    Recruiting
    Personalauswahl mit KI kann Unternehmen schaden

    Software ist objektiv und kennt keine Vorurteile, das macht Künstliche Intelligenz interessant für die Personalauswahl. Ist KI also besser als Personaler? Die Bewerber sind skeptisch und die Wissenschaft liefert keinen Beweis dafür.
    Ein Bericht von Peter Ilg

  3. Gerichtsurteil: MDR darf Facebook-Kommentare ohne Sendungsbezug löschen
    Gerichtsurteil
    MDR darf Facebook-Kommentare ohne Sendungsbezug löschen

    Öffentlich-rechtliche Sender begehen keine Zensur, wenn sie nicht strafbare Kommentare auf Facebook löschen. Manchmal sind sie eher dazu verpflichtet.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bestellbar • Tiefstpreise: Crucial SSD 4TB 319€, Palit RTX 4080 1.499€, HTC Vive Pro 2 659€ • Alternate: Team Group SSD 512GB 29,99€, AOC Curved 27" 240 Hz 199,90€ • Samsung Cyber Week • Top-TVs (2022) LG & Samsung über 40% günstiger • AOC Curved 34" WQHD 389€ [Werbung]
    •  /