MLPerf Training: Google und Graphcore überholen Nvidia

Mit den TPU-v4- und den Colossus-Chips haben Nvidias A100 starke Konkurrenz beim Training von künstlicher Intelligenz erhalten.

Artikel veröffentlicht am ,
Ein IPU-Pod4 mit vier Colossus MK2 GC200
Ein IPU-Pod4 mit vier Colossus MK2 GC200 (Bild: Graphcore)

Die ersten Resultate der MLPerf-Training-v1.0-Suite sind da, diese bündelt mehrere Benchmarks für künstliche Intelligenz wie Bilderklassifizierung, Objekterkennung und Sprachverarbeitung. Unternehmen können die Resultate ihrer Server einreichen, was in einer umfangreichen Datenbank für sechs sehr verschiedene KI-Anwendungen resultiert.

Stellenmarkt
  1. Senior Software Entwickler / Technischer Projektleiter (w/m/d)
    EURO-LOG AG, Hallbergmoos
  2. Auditor ISO 27001 (m/w/d) Produktmanagement
    DQS GmbH Deutsche Gesellschaft zur Zertifizierung von Managementsystemen, Frankfurt am Main
Detailsuche

Auch wenn bei den meisten Systemen die Nvidia A100 als Beschleuniger verwendet wird, gibt es Konkurrenz: Google schickt die TPUs v4 ins Rennen, von Graphcore stammen die Colossus MK2 GC200, von Huawei die Ascend 910 und von Intel die Habana Gaudi. Als Host-CPUs kommen entweder AMDs Epyc 7002/7003, Intels Xeon SP (Cascade/Cooper/Ice Lake) oder die ARM-basierten Kunpeng 920 zum Einsatz.

TPUv4 gewinnen vier von sechs Benchmarks

Google etwa sieht sich mit den TPU v4 (Tensor Processing Unit) deutlich vor Nvidia: Der Performance-Vorsprung liegt laut Hersteller bei 10 Prozent bis 74 Prozent, in zwei von sechs Benchmarks gewinnen die A100. Google hat ein TPU-v4-Pod mit 4.096 dieser ASICs verwendet, konnte aber nur 3.456 der Chips auslasten. Die Nvidia-Werte wurden auch mit bis zu 4.096 der A100 mit 80 GByte erstellt und stammen direkt von Jensens Team.

Ebenfalls spannend sind die Resultate von Graphcore, die für sich beanspruchen, Nvidia bei den Kosten zu schlagen. Der britische Hersteller vergleicht dabei das eigene IPU-Pod16 mit ebenso vielen Colossus-IPUs, die gegen ein deutlich teureres DXG A100 von Nvidia mit acht der Beschleuniger antreten. Zwar ist das Graphcore-System bei BERT und ResNet nicht schneller, der IPU-Pod16 soll aber das bessere Preis-Leistungs-Verhältnis (Listenanschaffungskosten des Systems) aufweisen und so punkten.

Golem Karrierewelt
  1. CEH Certified Ethical Hacker v11: virtueller Fünf-Tage-Workshop
    01.-05.08.2022, Virtuell
  2. Kubernetes – das Container Orchestration Framework: virtueller Vier-Tage-Workshop
    11.-14.07.2022, Virtuell
Weitere IT-Trainings

Von Lenovo kommen erste Werte mit acht Habana Gaudi, wie Intel sie anbietet. Das Training von Resnet dauert damit doppelt so lange wie mit acht Nvidia A100, wohingegen die 164 Minuten für BERT ein sehr schlechter Wert sind - eventuell ist hier die Software noch das Problem, da die Nvidia A100 gerade knapp 22 Minuten benötigen. Die Habana Gaudi werden unter anderem von AWS eingesetzt, die EC2-Instanzen sollen 40 Prozent mehr Performance pro US-Dollar erreichen als die mit den Nvidia A100.

NVIDIA-Grafikkarten bei Alternate

Zu guter Letzt gibt es Resultate von Huaweis selbst entwickelten Ascend 910, die mit ebenfalls selbst entworfenen ARM-CPUs kombiniert wurden. 1.024 dieser KI-Beschleuniger schaffen bei ResNet in etwa die Geschwindigkeit von 1.024 Nvidia A100, bei BERT sind aber 128 davon ein bisschen langsamer als halb so viele Ampere-Beschleuniger.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


martinalex 02. Jul 2021

Gibt's dafür auch Zahlen?

ms (Golem.de) 02. Jul 2021

Anschaffungskosten des Systems, also DGX A100 bzw IPU-Pod16.

ms (Golem.de) 02. Jul 2021

Die MLPerf-Werte sind leider kreuz und quer gemischt, daher ist eine Tabelle schwierig...



Aktuell auf der Startseite von Golem.de
SFConservancy
Open-Source-Entwickler sollen Github wegen Copilot verlassen

Ähnlich wie schon vor Jahrzehnten mit Sourceforge sollen Open-Source-Projekte nun auch Github verlassen.

SFConservancy: Open-Source-Entwickler sollen Github wegen Copilot verlassen
Artikel
  1. Chrome OS Flex: Das Apple Chromebook
    Chrome OS Flex
    Das Apple Chromebook

    Ein zehn Jahre altes Notebook lässt sich mit Chrome OS Flex wieder flott machen. Wir haben Googles Betriebssystem ausprobiert und waren begeistert.
    Ein Erfahrungsbericht von Martin Wolf

  2. Ransomware: Universität erzielt durch Lösegeldrückzahlung Gewinn
    Ransomware
    Universität erzielt durch Lösegeldrückzahlung Gewinn

    Die Universität Maastricht wurde nach einem Ransomware-Angriff erpresst und zahlte. Krypto-Kursschwankungen führten nun zu einem finanziellen Gewinn.

  3. Krypto-Hedgefunds: Three Arrows Capital ist offiziell insolvent
    Krypto-Hedgefunds
    Three Arrows Capital ist offiziell insolvent

    Neue Informationen zeigen, dass es beim Krypto-Fonds Three Arrows Capital zahlreiche Ungereimtheiten gibt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI RTX 3080 12GB günstig wie nie: 949€ • AMD Ryzen 7 günstig wie nie: 259€ • Der beste 2.000€-Gaming-PC • Cooler Master 34" UWQHD 144 Hz günstig wie nie: 467,85€ • Asus RX 6900 XT OC günstig wie nie: 1.049€ • Mindstar (Gigabyte RTX 3060 399€) • Galaxy Watch3 45 mm 119€ [Werbung]
    •  /