Cloud Next: Google nutzt Nvidias Tesla P4 für Inferencing

Wer künftig nach dem Trainingsschritt das Inferencing für maschinelles Lernen beschleunigen möchte, für den hat Google die passende Cloud-Plattform: Darin stecken Tesla P4 von Nvidia, die eine hohe INT8-Performance mit einer geringen Leistungsaufnahme kombinieren.

Artikel veröffentlicht am ,
Google wird künftig die Tesla P4 nutzen.
Google wird künftig die Tesla P4 nutzen. (Bild: Nvidia)

Die Cloud-Plattform soll bald mit Nvidias Tesla P4 ausgerüstet werden, das gab Google auf der hauseigenen Cloud-Next-Konferenz bekannt. Bisher verwendet der Anbieter vorrangig Nodes rein mit CPUs oder solche, in denen Nvidias Tesla P100 oder Tesla V100 stecken. Diese teuren Beschleunigerkarten sind jedoch in erster Linie für Workloads ausgelegt, die FP32- oder FP64-Leistung für das Training neuronaler Netze benötigen oder auf spezielle Matrix-Multiplikationen für künstliche Intelligenz setzen. Die Tesla P4 hingegen liefern vor allem viel INT8-Geschwindigkeit für den Inferencing-Schritt.

Stellenmarkt
  1. Junior Salesforce Berater / Entwickler (m/w/d)
    ilum:e informatik AG, Mainz
  2. Consultant Backup (m/w/d)
    ORBIT Gesellschaft für Applikations- und Informationssysteme mbH, Bonn
Detailsuche

Google hat sich bisher nicht dazu geäußert, wann genau für Kunden die Nodes mit den Tesla P4 verfügbar sein sollen und auch keine Preise für die Instanzen bekanntgegeben. Die Nodes sind vor allem für Bild-, Sprach-, Text- oder Videoerkennung im Kontext von künstlicher Intelligenz gedacht. Das Inferencing folgt nach dem Training, ein bereits angelerntes Netz wird damit beschleunigt und weiter verfeinert. Beide Schritte können grundsätzlich mit gleicher Präzision erfolgen, es ist jedoch oft effizienter und schneller, wenn dafür unterschiedliche Beschleunigertypen eingesetzt werden. Google selbst bietet mit den TPUs (Tensor Processing Units) eigene Chips für maschinelles Lernen an.

Bei den Tesla P4 handelt es sich um PCIe-Steckkarten mit einem GP104-Chip, wie er von der Geforce GTX 1080/1070 bekannt ist. Die GPU taktet aber mit 810 MHz weniger als halb so schnell, was die Beschleuniger sehr effizient macht. Der GDDR5-Videospeicher fasst 8 GByte und die TDP liegt bei gerade einmal 75 Watt. Mit INT8-Genauigkeit erreicht eine Tesla P4 rund 55 Tera-Ops für maschinelles Lernen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Truebit 28. Jul 2018

Quelle? Gibt es das (schon) für "die breite Masse" bzw. B2B? Meldung von 2016 über 2010...

JouMxyzptlk 25. Jul 2018

obwohl die CPU ja overpowered ist da sie 64 KB adressieren kann und nicht 100% INT8 ist...

flow77 25. Jul 2018

Wie viele Frames schafft das Ding in Q3? :-]



Aktuell auf der Startseite von Golem.de
Ladeinfrastruktur
So sollen 15 Millionen E-Autos ans Netz kommen

In mehreren Feldversuchen hat Netze BW die Elektrifizierung von Straßen und Tiefgaragen getestet. Die Ergebnisse könnten anderen Netzbetreibern als Vorlage dienen.
Ein Bericht von Friedhelm Greis

Ladeinfrastruktur: So sollen 15 Millionen E-Autos ans Netz kommen
Artikel
  1. Entlassungen bei Tech-Unternehmen: Welche Branchen zurzeit am stärksten betroffen sind
    Entlassungen bei Tech-Unternehmen
    Welche Branchen zurzeit am stärksten betroffen sind

    Das Jahr ist von Massenentlassungen bei Tech-Unternehmen geprägt. Wir haben per Open Data analysiert, welche Branchen das besonders betrifft.
    Von Felix Uelsmann

  2. Mydlink Home: D-Link macht Smart-Home-Geräte unbrauchbar
    Mydlink Home
    D-Link macht Smart-Home-Geräte unbrauchbar

    D-Link wird in Kürze alle Clouddienste für eine Reihe verschiedener Smart-Home-Geräte einstellen und diese quasi unbrauchbar machen.

  3. Jetzt 50 Prozent bei IT-Workshops sparen!
     
    Jetzt 50 Prozent bei IT-Workshops sparen!

    Nur noch bis Mittwoch: Workshops, E-Learning-Kurse, Coachings und vieles mehr zum halben Preis! Jetzt zuschlagen und den Preisvorteil nutzen!
    Sponsored Post von Golem Karrierewelt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bestellbar • Samsung Cyber Week • Top-TVs (2022) LG & Samsung über 40% günstiger • AOC Curved 34" WQHD 389€ • Palit RTX 4080 1.499€ • Astro A50 Gaming-Headset PS4/PS5/PC günstiger • Gigabyte RX 6900 XT 799€ • Thrustmaster Flight Sticks günstiger [Werbung]
    •  /