Compute Engine A2: Google packt Nvidias A100 in die Cloud

Die A2-Compute-Engine kombinieren Ampere-Beschleuniger mit Intel-CPUs.

Artikel veröffentlicht am ,
Logo der Cloud Compute Engine
Logo der Cloud Compute Engine (Bild: Google)

Google hat als erster Cloud-Anbieter mehrere Instanzen veröffentlicht, die Nvidias A100-Beschleuniger nutzen. Die Compute Engine A2 basiert auf Systemen von Nvidia, die Google mit Intel-Prozessoren kombiniert. Vorerst sind die Instanzen nur per privatem Alpha-Programm verfügbar, sie eignen sich für maschinelles Lernen - also Training sowie Inferencing - und für High Performance Computing (HPC).

Stellenmarkt
  1. Expertinnen bzw. Experten Qualitätssicherung in der Softwareentwicklung (w/m/d) im Referat ... (m/w/d)
    Statistisches Bundesamt, Wiesbaden
  2. Product Owner (m/w/d)
    QUNDIS GmbH, Erfurt
Detailsuche

Technische Basis der Compute Engine A2 sind die HGX-100-Plattformen von Nvidia im Vollausbau. Diese kombinieren zwei per Switch verbundene Platinen mit je acht A100-Beschleunigern in SMX4-Bausweise. Folgerichtig bietet Google die Instanzen bis zu hin einer als A2-MegaGPU-16g bezeichneten Version an. Neben den Nvidia-Modulen gibt es bis zu 96 vCPUs - genauer Cascade Lake von Intel - und bis zu 1,36 TByte Arbeitsspeicher. Die kleinste Version namens A2-HighGPU-1g nutzt einen A100-Beschleuniger mit zwölf vCPUs und 85 GByte RAM.

Die A100, die nicht mehr zusätzlich Tesla heißen, sind Nvidias aktuelle Beschleuniger für Server. Sie basieren auf dem GA100-Grafikchip mit Ampere-Architektur und wurden im Mai 2020 vorgestellt. Bei vorherigen Generationen dauerte es teils sehr viel länger bis Google oder ein anderer Anbieter die jeweiligen Beschleuniger in der eigenen Cloud verbaute und anbot - zwei Jahre bei Kepler, ein Jahr bei Pascal sowie fünf Monate bei Volta.

  • Cloud Compute Engine A2 (Bild: Google)
  • Cloud Compute Engine A2 (Bild: Google)
Cloud Compute Engine A2 (Bild: Google)
Tesla V100 (SXM2)Nvidia A100 (SXM4)Nvidia A100 (PCIe)
GPU (µArch)GV100 (Volta), teilaktiviertGA100 (Ampere), teilaktiviertGA100 (Ampere), teilaktiviert
Node12FFN (TSMC)7N (TSMC)7N (TSMC)
Transistoren21,1 Milliarden54,2 Milliarden54,2 Milliarden
ALUs / Tensor5.120 / 6406.912 / 4326.912 / 432
Speicher32 GByte HBM240 GByte HBM2 / 80 GByte HBM2e40 GByte HBM2
Bandbreite900 GByte/s1,555 TByte/s bzw über 2 TByte/s1,555 TByte/s
FP647,45 Teraflops9,7 (19,5*) Teraflops9,7 (19,5*) Teraflops
FP3214,9 Teraflops19,5 Teraflops19,5 Teraflops
FP16125 Teraflops312 (624**) Teraflops312 (624**) Teraflops
INT862 Teraops624 (1.248**) Teraops624 (1.248**) Teraops
TDP300 Watt400 Watt250 Watt
NV-Link300 GByte/s (8x GPUs)600 GByte/s (8x GPUs)600 GByte/s (2x GPUs)
InterfacePCIe Gen3PCIe Gen4PCIe Gen4
Technische Daten von Nvidias Tesla V100 und A100 *viaTensor Cores **mit Sparsity

Beim GA100 hat sich Nvidia vor allem auf die für maschinelles Lernen wichtige Leistung konzentriert und die Tensor-Cores drastisch verbessert. Der mit 826 mm² riesige 7-nm-Chip erreicht dadurch eine sehr hohe Leistung bei INT8- und FP16-Berechnungen, zudem können die A100-Beschleuniger dank 48 GByte HBM2-Stapelspeicher viele Daten lokal vorhalten und schnell einladen. Neben dem Modell mit SMX4-Mezzanine-Modul hat Nvidia auch eine PCIe-Gen4-Steckkarte mit GA100 vorgestellt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Silence S04
Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt

Beim Elektroauto Silence S04 kann der Nutzer den Akku selbst wechseln, wenn dieser leergefahren ist.

Silence S04: Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt
Artikel
  1. Microsoft: Das nächste große Update für Windows 10 kommt im November
    Microsoft
    Das nächste große Update für Windows 10 kommt im November

    Die Version 21H2 wurde wohl auch wegen Windows 11 etwas nach hinten verschoben. Der Patch soll nun aber im November für Windows 10 kommen.

  2. Arduino und Python: Bastler nimmt Audiokassette als Speichermedium für Retro-PC
    Arduino und Python
    Bastler nimmt Audiokassette als Speichermedium für Retro-PC

    Die Kassette kann nicht nur Lieder speichern, sondern auch Bitmuster. Ein Bastler baut dafür eine Schnittstelle mit 1,5 KBit/s Datenrate.

  3. Bis Ende 2022: VW-Manager müssen wegen Chipkrise Verbrenner fahren
    Bis Ende 2022
    VW-Manager müssen wegen Chipkrise Verbrenner fahren

    2022 werden VWs Manager den Kurs des Unternehmenschefs Herbert Diess nicht fahren können - Elektroautos und Hybride können als Dienstwagen nicht bestellt werden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AOC CQ32G2SE/BK 285,70€ • Dell Alienware AW2521H 360 Hz 499€ • Corsair Vengeance RGB PRO SL 64-GB-Kit 3600 253,64€ • DeepCool Castle 360EX 109,90€ • Phanteks Glacier One 240MP 105,89€ • Seagate SSDs & HDDs günstiger • Alternate (u. a. Thermaltake Core P3 TG Snow Ed. 121,89€) [Werbung]
    •  /