Not macht erfinderisch: Fehlende Rechen-GPUs machen Chinas KI-Branche kreativ

Die KI-Branche in China muss mit alter Hardware arbeiten. Doch das könnte Innovationen beflügeln.

Artikel veröffentlicht am , Johannes Hiltscher
Wer wenig Rechenleistung zur Verfügung hat, muss sich genau überlegen, wie er sie nutzt.
Wer wenig Rechenleistung zur Verfügung hat, muss sich genau überlegen, wie er sie nutzt. (Bild: Marco Verch, Flickr/CC-BY 2.0)

Auch in China ist künstliche Intelligenz ein riesiges Geschäft, und das wollen sich Firmen wie Baidu oder Alibaba nicht von Exportbeschränkungen kaputtmachen lassen. Die rechenaufwendigen Trainings großer Sprachmodelle (Large Language Models, LLMs) sind nur mit leistungsfähigen Beschleunigern zu bewältigen, deren Verkauf in die Volksrepublik die US-Regierung verbietet. Das Wall Street Journal hat sich angesehen, wie die betroffenen Unternehmen darauf reagieren.

Dazu werteten die Autoren wissenschaftliche Veröffentlichungen aus, die zeigen: Chinesische Forscher versuchen, mit mehr und aggressiverer Optimierung die verfügbare Rechenleistung besser zu nutzen. Gleichzeitig beschränken die betroffenen Unternehmen den Zugriff auf die vorhandene, noch unbeschränkte Hardware – rund 40.000 bis 50.000 A100 von Nvidia sollen es sein – auf besonders wichtige Projekte. Als Beispiel wird Baidus Ernie Bot genannt, der ChatGPT Konkurrenz machen soll.

Beide Maßnahmen sind ein Gebot der ökonomischen Vernunft: Während andere Unternehmen Nvidias leistungsstarke H100 nutzen können, ist in China nur eine eingeschränkte Variante erhältlich. Bereits die A800 für den chinesischen Markt ist deutlich langsamer als die A100, beim Nachfolger H800 dürfte der Unterschied noch gravierender sein. Um die Rechenleistung der H100 annähernd zu erreichen, würden, so ein vom Wall Street Journal befragter Experte, Unternehmen bis zu vier ältere Beschleuniger kombinieren. Dieser Ansatz ist zwar einfach, aber auch teuer. Für das Training eines komplexen LLMs wie ChatGPT sind Schätzungen zufolge 5.000 bis 10.000 A100 erforderlich – Tendenz steigend.

Unübliche Ansätze könnten neue Einsichten liefern

Ein weiterer, eher ungewöhnlicher Ansatz: Rechenbeschleuniger mehrerer Hersteller oder verschiedener Generationen kombinieren. Die Herausforderung hierbei ist, die unterschiedliche Rechenleistung auszugleichen. Andernfalls könnte die leistungsschwächere Hardware die rechenstärkeren Beschleuniger ausbremsen.

Die Not der chinesischen Unternehmen könnte dabei auch anderen Unternehmen zugutekommen: Veröffentlichen sie ihre Ergebnisse weiter, können alle aus Versuchen lernen, die bei reichlich vorhandener Rechenleistung möglicherweise nie stattgefunden hätten.

Das Wall Street Journal gibt zudem einen Hinweis, weshalb Hardware aus den USA in China noch immer beliebt ist, obwohl das Land eigene KI-Beschleuniger entwickelt hat: Die eigene Hardware sei oft unzuverlässig, so die Zeitung unter Berufung auf ungenannte, mit der KI-Entwicklung bei Baidu vertraute Personen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Kadjus 11. Mai 2023 / Themenstart

Da muss man erstmal drauf kommen den Code auch zu optimieren und nicht einfach per...

lunarix 10. Mai 2023 / Themenstart

Und wir drei wissen doch ganz genau, dass nicht nur die Chinesen das so handhaben. Also...

fanreisender 10. Mai 2023 / Themenstart

Ganz zweifellos. Aber wie genau soll das im konkreten Fall geschehen. Irgendwie lese ich...

Kommentieren



Aktuell auf der Startseite von Golem.de
Google Street View
Deutschland bekommt keine Möglichkeit zur Zeitreise

Mit der überfälligen Aktualisierung verliert Street View auch das alte Bildmaterial - und das hat nicht nur mit Datenschutz zu tun.
Von Daniel Ziegener

Google Street View: Deutschland bekommt keine Möglichkeit zur Zeitreise
Artikel
  1. Technische Schulden: Was Accidental Complexity in der Entwicklung kostet
    Technische Schulden
    Was Accidental Complexity in der Entwicklung kostet

    Anfangs setzen IT-Teams schnell neue Features um, dann wird die Entwicklungszeit meist länger. Accidental Complexity ist häufig die Ursache - wir erklären, wie sie entsteht und was sich dagegen tun lässt.
    Von Marcus Held

  2. Saporischschja: AKW ist nach Staudammzerstörung mittelfristig in Gefahr
    Saporischschja
    AKW ist nach Staudammzerstörung mittelfristig in Gefahr

    Ein Experte für Reaktorsicherheit befürchtet, dass dem Atomkraftwerk Saporischschja das Kühlwasser ausgeht.

  3. Wissenschaft: In Energydrinks enthaltenes Taurin könnte Leben verlängern
    Wissenschaft
    In Energydrinks enthaltenes Taurin könnte Leben verlängern

    Wissenschaftler haben Anzeichen dafür entdeckt, dass Taurin die Gesundheit verbessern und das Leben verlängern könnte. Mehr Energydrinks sollte man aber nicht trinken.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • XXL-Sale bei Alternate • MindStar: MSI G281UVDE 269€, ASRock RX 6700 XT Phantom D OC 379€, XFX Speedster MERC 319 RX 6800 XT Core 559€ • Corsair Vengeance RGB PRO SL DDR4-3600 32 GB 79,90€ • Corsair K70 RGB PRO 125,75€ • SHARP 65FN6E Android Frameless TV 559,20€ [Werbung]
    •  /