Deep Learning: Googles Cloud-TPU kosten 6,50 US-Dollar pro Stunde

Die Deep-Learning-Beschleuniger von Google lassen sich nun in einem offenen Betaprogramm der sogenannten Cloud-TPU testen. Für Machine-Learning-Aufgaben sollen aber weiter auch Skylake-CPUs und Nvidias GPUs bereitstehen.

Artikel veröffentlicht am ,
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen.
Die Cloud-TPU lassen sich jetzt auch offiziell von allen nutzen. (Bild: Google)

Mit den Cloud-TPU hat Google auf seiner Entwicklerkonferenz I/O im vergangenen Frühjahr die zweite Generation seiner Tensor Processing Units (TPU) genannten Deep-Learning-Beschleuniger vorgestellt. Nach einer anmeldepflichtigen Alpha-Testphase sowie einem speziell an Forscher gerichteten Angebot startet Google nun eine offene Beta für die Verwendung der Cloud-TPU.

Stellenmarkt
  1. Linux DevOps Professional (m/w/d)
    Haufe Group, Freiburg im Breisgau
  2. Manager Systeme, Anwendungen und Daten (m/w/d)
    MVV Netze GmbH, Mannheim
Detailsuche

Die Rechenleistung zu mieten, soll 6,50 US-Dollar pro Stunde und Cloud-TPU kosten. Die vergleichsweise große Nachfrage nach den TPU bei nach wie vor knappen Hardware-Ressourcen versucht Google durch eine Anmeldung für die Beta-Phase zu lösen. Google verspricht aber seinen Kunden, so schnell wie möglich Zugriff auf die Cloud-TPU geben zu wollen.

Diese nun verfügbare zweite Generation kann nicht nur das Inferencing beschleunigen, also das Anwenden bereits trainierter Modelle, sondern unterstützt auch explizit das Training völlig neuer Modelle. Damit Kunden das möglichst einfach umsetzen können, lassen sich die Cloud-TPU mit dem von Google unterstützten Framework Tensorflow verwenden. Für einen einfachen Start hat Google auch Referenzmodelle für diesen Aufbau als Open-Source-Software veröffentlicht.

Rechenstarke Hardware in der Cloud

Eine einzelne Recheneinheit der zweiten Generation der TPU besteht aus zwei Kernen. In jedem Kern stecken wiederum eine Einheit für Skalar- und Vektor-Operationen, die 32 Bit Fließkommazahlen verarbeiten kann, und eine Einheit zur Matrix-Multiplikation der Größe 128 x 128. Letztere arbeitet ebenfalls mit 32 Bit Fließkommazahlen. Für die Multiplikatoren kann jedoch auch mit reduzierter Genauigkeit gearbeitet werden, was besonders für Training von Deep-Learning-Modellen von Vorteil ist.

  • Die zweite Generation der TPU von oben ... (Bild: Google)
  • ... und von der Seite. (Bild: Google)
  • Die neuen TPUs stapelt Google in seinen Rechenzentren zu Servern. (Bild: Google)
Die zweite Generation der TPU von oben ... (Bild: Google)
Golem Akademie
  1. ITIL 4® Foundation: virtueller Zwei-Tage-Workshop
    16.–17. Dezember 2021, virtuell
  2. Penetration Testing Fundamentals: virtueller Zwei-Tage-Workshop
    17.–18. Januar 2022, Virtuell
Weitere IT-Trainings

Jeder der Kerne kann auf 8 GByte HBM-Speicher zugreifen. Ob es sich hier um einen 8 GByte-Chip und mehrere kleine handelt, ist nicht bekannt. Die gesamte Speicherbandbreite eines einzelnen TPU-Chips beträgt zudem 600 GByte/s. Eine einzelne Einheit komme so laut Google auf eine Rechenleistung von 45 Teraflops. Von diesen Chips werden je vier auf einem Board angebracht, das Google dann TPU v2 nennt und entsprechend eine Leistung von 180 Teraflops haben soll.

Diese Boards werden von Google selbst nach Angaben des Unternehmens zu einem Cluster aus 64 Stück zusammengefasst, was das Unternehmen als Pod bezeichnet. Solch ein Pod hat dann eine theoretische Rechenleistung von 11,5 Petaflops und Zugriff auf insgesamt 4 TByte HBM-Speicher. Noch lassen sich diese TPU-Pods jedoch nicht dediziert mieten. Die TPU-Pods sollen später im Jahr im Cloud-Angebot von Google zur Verfügung stehen.

Zusätzlich zu den TPU sollen Googles Kunden, die auf Machine Learning setzen, aber auch weiterhin Zugriff auf verschiedene leistungsstarke CPUs wie die aktuelle Skylake-Generation erhalten sowie auch auf die sogenannten Cloud-GPUs, über die auch Nvidias Tesla V100 bereitsteht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Snapdragon 8 Gen1
Der erste ARMv9-Smartphone-Drache ist da

Neuer Name, neue Kerne: Der Snapdragon 8 Gen1 nutzt ARMv9-Technik, auch das 5G-Modem und die künstliche Intelligenz sind viel besser.

Snapdragon 8 Gen1: Der erste ARMv9-Smartphone-Drache ist da
Artikel
  1. 470 - 694 MHz: Streit um DVB-T2 und Veranstalterfrequenzen spitzt sich zu
    470 - 694 MHz
    Streit um DVB-T2 und Veranstalterfrequenzen spitzt sich zu

    Nach dem Vorstoß von Baden-Württemberg, einen Teil des Frequenzbereichs an das Militär zu vergeben, gibt es nun Kritiken daran aus anderen Bundesländern.

  2. Prozessoren: Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus
    Prozessoren
    Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus

    Tausende ältere CPUs und andere Hardware lagern bei Intel in einem Lagerhaus in Costa Rica. Damit lassen sich Probleme exakt nachstellen.

  3. Factorial Energy: Mercedes und Stellantis investieren in Feststoffbatterien
    Factorial Energy
    Mercedes und Stellantis investieren in Feststoffbatterien

    Durch Festkörperakkus sollen Elektroautos sicherer werden und schneller laden. Doch mit einer schnellen Serienproduktion ist nicht zu rechnen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Nur noch heute: Bis zu 75% auf Switch-Spiele • AOC 31,5" WQHD 165Hz 289,90€ • Gaming-Sale bei MediaMarkt • G.Skill 64GB Kit DDR4-3800 319€ • Bis zu 300€ Direktabzug: u. a. TVs, Laptops • WD MyBook HDD 18TB 329€ • Switch OLED 359,99€ • Xbox Series S 275,99€ [Werbung]
    •  /