Deep Learning: Googles Cloud-TPU kosten 6,50 US-Dollar pro Stunde

Die Deep-Learning-Beschleuniger von Google lassen sich nun in einem offenen Betaprogramm der sogenannten Cloud-TPU testen. Für Machine-Learning-Aufgaben sollen aber weiter auch Skylake-CPUs und Nvidias GPUs bereitstehen.

Artikel veröffentlicht am ,
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen.
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen. (Bild: Google)

Mit den Cloud-TPU hat Google auf seiner Entwicklerkonferenz I/O im vergangenen Frühjahr die zweite Generation seiner Tensor Processing Units (TPU) genannten Deep-Learning-Beschleuniger vorgestellt. Nach einer anmeldepflichtigen Alpha-Testphase sowie einem speziell an Forscher gerichteten Angebot startet Google nun eine offene Beta für die Verwendung der Cloud-TPU.

Stellenmarkt
  1. (Junior) SAP HCM Key User People Operations (w/m/d)
    Helmholtz-Zentrum Berlin für Materialien und Energie GmbH, Berlin
  2. Teamleiter IT-Lösungen Justiz (w/m/d)
    Dataport, Altenholz bei Kiel, Hamburg
Detailsuche

Die Rechenleistung zu mieten, soll 6,50 US-Dollar pro Stunde und Cloud-TPU kosten. Die vergleichsweise große Nachfrage nach den TPU bei nach wie vor knappen Hardware-Ressourcen versucht Google durch eine Anmeldung für die Beta-Phase zu lösen. Google verspricht aber seinen Kunden, so schnell wie möglich Zugriff auf die Cloud-TPU geben zu wollen.

Diese nun verfügbare zweite Generation kann nicht nur das Inferencing beschleunigen, also das Anwenden bereits trainierter Modelle, sondern unterstützt auch explizit das Training völlig neuer Modelle. Damit Kunden das möglichst einfach umsetzen können, lassen sich die Cloud-TPU mit dem von Google unterstützten Framework Tensorflow verwenden. Für einen einfachen Start hat Google auch Referenzmodelle für diesen Aufbau als Open-Source-Software veröffentlicht.

Rechenstarke Hardware in der Cloud

Eine einzelne Recheneinheit der zweiten Generation der TPU besteht aus zwei Kernen. In jedem Kern stecken wiederum eine Einheit für Skalar- und Vektor-Operationen, die 32 Bit Fließkommazahlen verarbeiten kann, und eine Einheit zur Matrix-Multiplikation der Größe 128 x 128. Letztere arbeitet ebenfalls mit 32 Bit Fließkommazahlen. Für die Multiplikatoren kann jedoch auch mit reduzierter Genauigkeit gearbeitet werden, was besonders für Training von Deep-Learning-Modellen von Vorteil ist.

  • Die zweite Generation der TPU von oben ... (Bild: Google)
  • ... und von der Seite. (Bild: Google)
  • Die neuen TPUs stapelt Google in seinen Rechenzentren zu Servern. (Bild: Google)
Die zweite Generation der TPU von oben ... (Bild: Google)
Golem Karrierewelt
  1. Git Grundlagen: virtueller Zwei-Tage-Workshop
    19./20.01.2023, Virtuell
  2. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    19.-22.12.2022, virtuell
Weitere IT-Trainings

Jeder der Kerne kann auf 8 GByte HBM-Speicher zugreifen. Ob es sich hier um einen 8 GByte-Chip und mehrere kleine handelt, ist nicht bekannt. Die gesamte Speicherbandbreite eines einzelnen TPU-Chips beträgt zudem 600 GByte/s. Eine einzelne Einheit komme so laut Google auf eine Rechenleistung von 45 Teraflops. Von diesen Chips werden je vier auf einem Board angebracht, das Google dann TPU v2 nennt und entsprechend eine Leistung von 180 Teraflops haben soll.

Diese Boards werden von Google selbst nach Angaben des Unternehmens zu einem Cluster aus 64 Stück zusammengefasst, was das Unternehmen als Pod bezeichnet. Solch ein Pod hat dann eine theoretische Rechenleistung von 11,5 Petaflops und Zugriff auf insgesamt 4 TByte HBM-Speicher. Noch lassen sich diese TPU-Pods jedoch nicht dediziert mieten. Die TPU-Pods sollen später im Jahr im Cloud-Angebot von Google zur Verfügung stehen.

Zusätzlich zu den TPU sollen Googles Kunden, die auf Machine Learning setzen, aber auch weiterhin Zugriff auf verschiedene leistungsstarke CPUs wie die aktuelle Skylake-Generation erhalten sowie auch auf die sogenannten Cloud-GPUs, über die auch Nvidias Tesla V100 bereitsteht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Urheberrechtsverletzung
US-Marine muss Strafe an deutsche Firma bezahlen

Noch während der Lizenzverhandlungen installierte die US-Marine eine Software auf über 500.000 Rechnern. Sechs Jahre später muss sie dafür bezahlen.

Urheberrechtsverletzung: US-Marine muss Strafe an deutsche Firma bezahlen
Artikel
  1. Karmesin und Purpur: Nintendo entschuldigt sich für Probleme mit Pokémon
    Karmesin und Purpur
    Nintendo entschuldigt sich für Probleme mit Pokémon

    Schwache Grafik und trotzdem Ruckler: Viele Spieler ärgern sich über den technischen Zustand von Pokémon Karmesin/Purpur.

  2. Bayern: Arbeitszeit von mehr als 10 Stunden am Tag gefordert
    Bayern
    Arbeitszeit von mehr als 10 Stunden am Tag gefordert

    Die bayerische Arbeitsministerin plädiert für mehr Flexibilität am Arbeitsplatz und will mehr als zehn Stunden Arbeit pro Tag erlauben.

  3. EuGH: Google legt erneut Einspruch gegen Milliardenstrafe ein
    EuGH
    Google legt erneut Einspruch gegen Milliardenstrafe ein

    Google will keine 4,125 Milliarden Euro zahlen und zieht mit dem Fall vor den Europäischen Gerichthof. Es geht um Android.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 jetzt bestellbar • LG OLED TV (2022) 55" 120Hz 949€ • Mindstar: Geforce RTX 4080 1.449€ • Tiefstpreise: G.Skill 32GB Kitt DDR5-7200 • 351,99€ Crucial SSD 4TB 319€, HTC Vive Pro 2 659€ • Samsung Cyber Week • Top-TVs (2022) LG & Samsung über 40% günstiger [Werbung]
    •  /