• IT-Karriere:
  • Services:

Cloud Next: Google nutzt Nvidias Tesla P4 für Inferencing

Wer künftig nach dem Trainingsschritt das Inferencing für maschinelles Lernen beschleunigen möchte, für den hat Google die passende Cloud-Plattform: Darin stecken Tesla P4 von Nvidia, die eine hohe INT8-Performance mit einer geringen Leistungsaufnahme kombinieren.

Artikel veröffentlicht am ,
Google wird künftig die Tesla P4 nutzen.
Google wird künftig die Tesla P4 nutzen. (Bild: Nvidia)

Die Cloud-Plattform soll bald mit Nvidias Tesla P4 ausgerüstet werden, das gab Google auf der hauseigenen Cloud-Next-Konferenz bekannt. Bisher verwendet der Anbieter vorrangig Nodes rein mit CPUs oder solche, in denen Nvidias Tesla P100 oder Tesla V100 stecken. Diese teuren Beschleunigerkarten sind jedoch in erster Linie für Workloads ausgelegt, die FP32- oder FP64-Leistung für das Training neuronaler Netze benötigen oder auf spezielle Matrix-Multiplikationen für künstliche Intelligenz setzen. Die Tesla P4 hingegen liefern vor allem viel INT8-Geschwindigkeit für den Inferencing-Schritt.

Stellenmarkt
  1. Diehl Metering GmbH, Ansbach
  2. monari GmbH, Gronau

Google hat sich bisher nicht dazu geäußert, wann genau für Kunden die Nodes mit den Tesla P4 verfügbar sein sollen und auch keine Preise für die Instanzen bekanntgegeben. Die Nodes sind vor allem für Bild-, Sprach-, Text- oder Videoerkennung im Kontext von künstlicher Intelligenz gedacht. Das Inferencing folgt nach dem Training, ein bereits angelerntes Netz wird damit beschleunigt und weiter verfeinert. Beide Schritte können grundsätzlich mit gleicher Präzision erfolgen, es ist jedoch oft effizienter und schneller, wenn dafür unterschiedliche Beschleunigertypen eingesetzt werden. Google selbst bietet mit den TPUs (Tensor Processing Units) eigene Chips für maschinelles Lernen an.

Bei den Tesla P4 handelt es sich um PCIe-Steckkarten mit einem GP104-Chip, wie er von der Geforce GTX 1080/1070 bekannt ist. Die GPU taktet aber mit 810 MHz weniger als halb so schnell, was die Beschleuniger sehr effizient macht. Der GDDR5-Videospeicher fasst 8 GByte und die TDP liegt bei gerade einmal 75 Watt. Mit INT8-Genauigkeit erreicht eine Tesla P4 rund 55 Tera-Ops für maschinelles Lernen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 58,48€ (PC), 68,23€ (PS4) 69,99€ (Xbox One)
  2. (-87%) 2,50€
  3. 10,48€
  4. (u. a. Warhammer 40,00€0: Gladius - Relics of War für 23,79€, Aggressors: Ancient Rome für 17...

Truebit 28. Jul 2018

Quelle? Gibt es das (schon) für "die breite Masse" bzw. B2B? Meldung von 2016 über 2010...

JouMxyzptlk 25. Jul 2018

obwohl die CPU ja overpowered ist da sie 64 KB adressieren kann und nicht 100% INT8 ist...

flow77 25. Jul 2018

Wie viele Frames schafft das Ding in Q3? :-]


Folgen Sie uns
       


Zhaxoin ZX-U6780U - Fazit

Wir testen den ZX-U6780U von Zhaxoin, einen achtkernigen x86-Prozessor aus China, der im 16-nm-Verfahren gefertigt wird. Die x86-Lizenz stammt von Centaur, einer Tochter von Via Technologies.

Zhaxoin ZX-U6780U - Fazit Video aufrufen
    •  /