Abo
  • Services:

Cloud Next: Google nutzt Nvidias Tesla P4 für Inferencing

Wer künftig nach dem Trainingsschritt das Inferencing für maschinelles Lernen beschleunigen möchte, für den hat Google die passende Cloud-Plattform: Darin stecken Tesla P4 von Nvidia, die eine hohe INT8-Performance mit einer geringen Leistungsaufnahme kombinieren.

Artikel veröffentlicht am ,
Google wird künftig die Tesla P4 nutzen.
Google wird künftig die Tesla P4 nutzen. (Bild: Nvidia)

Die Cloud-Plattform soll bald mit Nvidias Tesla P4 ausgerüstet werden, das gab Google auf der hauseigenen Cloud-Next-Konferenz bekannt. Bisher verwendet der Anbieter vorrangig Nodes rein mit CPUs oder solche, in denen Nvidias Tesla P100 oder Tesla V100 stecken. Diese teuren Beschleunigerkarten sind jedoch in erster Linie für Workloads ausgelegt, die FP32- oder FP64-Leistung für das Training neuronaler Netze benötigen oder auf spezielle Matrix-Multiplikationen für künstliche Intelligenz setzen. Die Tesla P4 hingegen liefern vor allem viel INT8-Geschwindigkeit für den Inferencing-Schritt.

Stellenmarkt
  1. TQ-Systems GmbH, Gut Delling bei München
  2. Hays AG, Baden-Württemberg

Google hat sich bisher nicht dazu geäußert, wann genau für Kunden die Nodes mit den Tesla P4 verfügbar sein sollen und auch keine Preise für die Instanzen bekanntgegeben. Die Nodes sind vor allem für Bild-, Sprach-, Text- oder Videoerkennung im Kontext von künstlicher Intelligenz gedacht. Das Inferencing folgt nach dem Training, ein bereits angelerntes Netz wird damit beschleunigt und weiter verfeinert. Beide Schritte können grundsätzlich mit gleicher Präzision erfolgen, es ist jedoch oft effizienter und schneller, wenn dafür unterschiedliche Beschleunigertypen eingesetzt werden. Google selbst bietet mit den TPUs (Tensor Processing Units) eigene Chips für maschinelles Lernen an.

Bei den Tesla P4 handelt es sich um PCIe-Steckkarten mit einem GP104-Chip, wie er von der Geforce GTX 1080/1070 bekannt ist. Die GPU taktet aber mit 810 MHz weniger als halb so schnell, was die Beschleuniger sehr effizient macht. Der GDDR5-Videospeicher fasst 8 GByte und die TDP liegt bei gerade einmal 75 Watt. Mit INT8-Genauigkeit erreicht eine Tesla P4 rund 55 Tera-Ops für maschinelles Lernen.



Anzeige
Blu-ray-Angebote
  1. (2 Monate Sky Ticket für nur 4,99€)
  2. (u. a. Outlander, House of Cards)

Truebit 28. Jul 2018 / Themenstart

Quelle? Gibt es das (schon) für "die breite Masse" bzw. B2B? Meldung von 2016 über 2010...

JouMxyzptlk 25. Jul 2018 / Themenstart

obwohl die CPU ja overpowered ist da sie 64 KB adressieren kann und nicht 100% INT8 ist...

flow77 25. Jul 2018 / Themenstart

Wie viele Frames schafft das Ding in Q3? :-]

Kommentieren


Folgen Sie uns
       


Subdomain Takeover - Interview mit Moritz Tremmel

Golem.de Redakteur Moritz Tremmel erklärt im Interview die Gefahren der Übernahme von Subdomains.

Subdomain Takeover - Interview mit Moritz Tremmel Video aufrufen
Always Connected PCs im Test: Das kann Windows 10 on Snapdragon
Always Connected PCs im Test
Das kann Windows 10 on Snapdragon

Noch keine Konkurrenz für x86-Notebooks: Die Convertibles mit Snapdragon-Chip und Windows 10 on ARM sind flott, haben LTE integriert und eine extrem lange Akkulaufzeit. Der App- und der Treiber-Support ist im Alltag teils ein Manko, aber nur eins der bisherigen Geräte überzeugt uns.
Ein Test von Marc Sauter und Oliver Nickel

  1. Miix 630 Lenovos ARM-Detachable kostet 1.000 Euro
  2. Qualcomm "Wir entwickeln dediziertes Silizium für Laptops"
  3. Windows 10 on ARM Microsoft plant 64-Bit-Support ab Mai 2018

Stromversorgung: Das Märchen vom Blackout durch Elektroautos
Stromversorgung
Das Märchen vom Blackout durch Elektroautos

Die massenhafte Verbreitung von Elektroautos stellt das Stromnetz vor neue Herausforderungen. Doch verschiedenen Untersuchungen zufolge sind diese längst nicht so gravierend, wie von Kritikern befürchtet.
Ein Bericht von Friedhelm Greis

  1. Elektromobilität iEV X ist ein Ausziehelektroauto
  2. Elektroautos Bundesrechnungshof hält Kaufprämie für unwirksam
  3. Ladekabel Startup Ubitricity gewinnt Klimaschutzpreis in New York

Threadripper 2990WX und 2950X im Test: Viel hilft nicht immer viel
Threadripper 2990WX und 2950X im Test
Viel hilft nicht immer viel

Für Workstations: AMDs Threadripper 2990WX mit 32 Kernen schlägt Intels ähnlich teure 18-Core-CPU klar und der günstigere Threadripper 2950X hält noch mit. Für das Ryzen-Topmodell muss aber die Software angepasst sein und sie darf nicht zu viel Datentransferrate benötigen.
Ein Test von Marc Sauter

  1. 32-Kern-CPU Threadripper 2990WX läuft mit Radeons besser
  2. Threadripper 2990WX AMDs 32-Kerner kostet weniger als Intels 18-Kerner
  3. Zhongshan Subor Z+ AMD baut SoC mit PS4-Pro-Leistung für chinesische Konsole

    •  /