Abo
  • IT-Karriere:

Deep Learning: Googles Cloud-TPU kosten 6,50 US-Dollar pro Stunde

Die Deep-Learning-Beschleuniger von Google lassen sich nun in einem offenen Betaprogramm der sogenannten Cloud-TPU testen. Für Machine-Learning-Aufgaben sollen aber weiter auch Skylake-CPUs und Nvidias GPUs bereitstehen.

Artikel veröffentlicht am ,
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen.
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen. (Bild: Google)

Mit den Cloud-TPU hat Google auf seiner Entwicklerkonferenz I/O im vergangenen Frühjahr die zweite Generation seiner Tensor Processing Units (TPU) genannten Deep-Learning-Beschleuniger vorgestellt. Nach einer anmeldepflichtigen Alpha-Testphase sowie einem speziell an Forscher gerichteten Angebot startet Google nun eine offene Beta für die Verwendung der Cloud-TPU.

Stellenmarkt
  1. Verlag C.H.BECK, München Schwabing
  2. Proximity Technology GmbH, Hamburg

Die Rechenleistung zu mieten, soll 6,50 US-Dollar pro Stunde und Cloud-TPU kosten. Die vergleichsweise große Nachfrage nach den TPU bei nach wie vor knappen Hardware-Ressourcen versucht Google durch eine Anmeldung für die Beta-Phase zu lösen. Google verspricht aber seinen Kunden, so schnell wie möglich Zugriff auf die Cloud-TPU geben zu wollen.

Diese nun verfügbare zweite Generation kann nicht nur das Inferencing beschleunigen, also das Anwenden bereits trainierter Modelle, sondern unterstützt auch explizit das Training völlig neuer Modelle. Damit Kunden das möglichst einfach umsetzen können, lassen sich die Cloud-TPU mit dem von Google unterstützten Framework Tensorflow verwenden. Für einen einfachen Start hat Google auch Referenzmodelle für diesen Aufbau als Open-Source-Software veröffentlicht.

Rechenstarke Hardware in der Cloud

Eine einzelne Recheneinheit der zweiten Generation der TPU besteht aus zwei Kernen. In jedem Kern stecken wiederum eine Einheit für Skalar- und Vektor-Operationen, die 32 Bit Fließkommazahlen verarbeiten kann, und eine Einheit zur Matrix-Multiplikation der Größe 128 x 128. Letztere arbeitet ebenfalls mit 32 Bit Fließkommazahlen. Für die Multiplikatoren kann jedoch auch mit reduzierter Genauigkeit gearbeitet werden, was besonders für Training von Deep-Learning-Modellen von Vorteil ist.

  • Die zweite Generation der TPU von oben ... (Bild: Google)
  • ... und von der Seite. (Bild: Google)
  • Die neuen TPUs stapelt Google in seinen Rechenzentren zu Servern. (Bild: Google)
Die zweite Generation der TPU von oben ... (Bild: Google)

Jeder der Kerne kann auf 8 GByte HBM-Speicher zugreifen. Ob es sich hier um einen 8 GByte-Chip und mehrere kleine handelt, ist nicht bekannt. Die gesamte Speicherbandbreite eines einzelnen TPU-Chips beträgt zudem 600 GByte/s. Eine einzelne Einheit komme so laut Google auf eine Rechenleistung von 45 Teraflops. Von diesen Chips werden je vier auf einem Board angebracht, das Google dann TPU v2 nennt und entsprechend eine Leistung von 180 Teraflops haben soll.

Diese Boards werden von Google selbst nach Angaben des Unternehmens zu einem Cluster aus 64 Stück zusammengefasst, was das Unternehmen als Pod bezeichnet. Solch ein Pod hat dann eine theoretische Rechenleistung von 11,5 Petaflops und Zugriff auf insgesamt 4 TByte HBM-Speicher. Noch lassen sich diese TPU-Pods jedoch nicht dediziert mieten. Die TPU-Pods sollen später im Jahr im Cloud-Angebot von Google zur Verfügung stehen.

Zusätzlich zu den TPU sollen Googles Kunden, die auf Machine Learning setzen, aber auch weiterhin Zugriff auf verschiedene leistungsstarke CPUs wie die aktuelle Skylake-Generation erhalten sowie auch auf die sogenannten Cloud-GPUs, über die auch Nvidias Tesla V100 bereitsteht.



Anzeige
Top-Angebote
  1. Notebooks, PCs und Monitore reduziert
  2. (u. a. Sandisk Plus 1-TB-SSD für 88€, WD Elements Desktop 4 TB für 79€)
  3. 219,99€
  4. 279€ (Bestpreis!)

the_hell 13. Feb 2018

1000Boards? Einfacher zu rechnen: Du mußt 10 Pods mieten um die weltweite Nummer eins zu...

Anonymer Nutzer 12. Feb 2018

Bin kein Experte, Ich glaube aber das die Dinger bei Ethereum nicht wirklich...


Folgen Sie uns
       


Linksabbiegen mit autonomen Autos - Bericht

In Braunschweig testet das DLR an zwei Ampeln die Vernetzung von automatisiert fahrenden Autos und der Verkehrsinfrastruktur.

Linksabbiegen mit autonomen Autos - Bericht Video aufrufen
Endpoint Security: IT-Sicherheit ist ein Cocktail mit vielen Zutaten
Endpoint Security
IT-Sicherheit ist ein Cocktail mit vielen Zutaten

Tausende Geräte in hundert verschiedenen Modellen mit Dutzenden unterschiedlichen Betriebssystemen. Das ist in großen Unternehmen Alltag und stellt alle, die für die IT-Sicherheit zuständig sind, vor Herausforderungen.
Von Anna Biselli

  1. Datendiebstahl Kundendaten zahlreicher deutscher Firmen offen im Netz
  2. Metro & Dish Tisch-Reservierung auf Google übernehmen
  3. Identitätsdiebstahl SIM-Dieb kommt zehn Jahre in Haft

Ricoh GR III im Test: Kompaktkamera mit Riesensensor, aber ohne Zoom
Ricoh GR III im Test
Kompaktkamera mit Riesensensor, aber ohne Zoom

Kann das gutgehen? Ricoh hat mit der GR III eine Kompaktkamera im Sortiment, die mit einem APS-C-Sensor ausgerüstet ist, rund 900 Euro kostet und keinen Zoom bietet. Wir haben die Kamera ausprobiert.
Ein Test von Andreas Donath

  1. Theta Z1 Ricoh stellt 360-Grad-Panoramakamera mit Profifunktionen vor
  2. Ricoh GR III Eine halbe Sekunde Belichtungszeit ohne Stativ

Erasure Coding: Das Ende von Raid kommt durch Mathematik
Erasure Coding
Das Ende von Raid kommt durch Mathematik

In vielen Anwendungsszenarien sind Raid-Systeme mittlerweile nicht mehr die optimale Lösung. Zu langsam und starr sind sie. Abhilfe schaffen können mathematische Verfahren wie Erasure Coding. Noch existieren für beide Techniken Anwendungsgebiete. Am Ende wird Raid aber wohl verschwinden.
Eine Analyse von Oliver Nickel

  1. Agentur für Cybersicherheit Cyberwaffen-Entwicklung zieht in den Osten Deutschlands
  2. Yahoo Richterin lässt Vergleich zu Datenleck platzen

    •  /