Zum Hauptinhalt Zur Navigation Zur Suche

Deep-Wisdom-Gründer: Chinesische KI nicht nur wegen US-Embargo ressourcensparend

Der Gründer des chinesischen Start-ups Deep Wisdom gibt im Gespräch mit Golem einen Einblick in den dortigen KI-Markt. Die theoretisch maximale Leistung eines Modells sei gar nicht das Ziel.
/ Achim Sawall
6 Kommentare News folgen (öffnet im neuen Fenster)
Alex Chenglin Wu, Gründer des chinesischen Start-ups Deep Wisdom (Bild: DeepWisdom)
Alex Chenglin Wu, Gründer des chinesischen Start-ups Deep Wisdom Bild: DeepWisdom

Chinesische KI-Ansätze seien nicht nur aufgrund der US-Sanktionen gegen High-End-Chips ressourceneffizienter. So antwortete Alex Chenglin Wu, Gründer des chinesischen Start-ups Deep Wisdom, das hinter dem Open-Source-Framework MetaGPT steht, auf Fragen von Golem. "Nein, das ist nicht der einzige Grund. Die US-Sanktionen gegen High-End-Chips stellen zwar für viele chinesische Technologieunternehmen eine echte Herausforderung dar."

Seit einiger Zeit hat Deep Wisdom seine Technologie in der Plattform Atoms, früher MGX, für den Massenmarkt zugänglich gemacht. Wu prägte den Begriff des Vibe Business: Ein Nutzer soll ein komplettes Unternehmen führen können, da die KI-Agenten die gesamte operative Ausführung wie Coding, Marketing, Design und SEO übernehmen.

Talente, Daten, Infrastruktur und Systemtechnik spielten ebenfalls eine wichtige Rolle in der KI-Entwicklung. Eine optimierte Pipeline könne "die Effizienz deutlich steigern", betonte Wu.

Effizienzgewinne ergäben sich auch durch die Verbesserung der gesamten Pipeline, einschließlich Datenbereinigung, Sample-Mixing, Design der Trainingsphase, Belohnungsmodellierung und Inferenzbereitstellung. "Eine ausgeprägte Entwicklerkultur mit ihrem Fokus auf Detailgenauigkeit und Effizienz kann KI-Entwickler dazu anspornen, unnötiges Training und wiederholte Berechnungen zu vermeiden", erklärte Wu.

Wenig Geld für Training

Vielen chinesischen KI-Start-ups fehle zudem der Zugang zu fast unbegrenztem Kapital, um die enormen Kosten für das Training fortschrittlicher Modelle zu decken. Sie stünden deshalb unter größerem Druck, die Rechenleistung zu maximieren, da sie "in einem stark kostensensiblen und wettbewerbsintensiven Markt agieren, in dem kostengünstige Implementierung und kommerzielle Rentabilität von Anfang an entscheidend sind", sagte Wu.

Dies schaffe stärkere Anreize, rechenintensive Techniken wie Quantisierung, Mixture-of-Experts-Architekturen und Inferenzoptimierung bereits früh im Entwicklungszyklus einzusetzen.

Wu betonte: "Ein weiterer Grund ist die Bereitschaft, architektonische Kompromisse einzugehen, um Kosten zu senken und die Implementierungseffizienz zu verbessern. Anstatt etwa die theoretisch maximale Leistungsfähigkeit eines Modells anzustreben, legen sie in der Praxis möglicherweise mehr Wert auf Inferenzgeschwindigkeit, Speichereffizienz und Serverkosten."

Huaweis Ascend: fast viermal so hoher Stromverbrauch

Deep Wisdom entwickele Produkte auf Anwendungsebene (2C), sagte Wu und gab eine kurze Bewertung der Hardware: Huaweis Ascend 910C werde im 7-nm-Verfahren von SMIC gefertigt und biete eine vergleichbare Leistung pro Chip wie Nvidias H100. Obwohl der Stromverbrauch fast viermal so hoch sei wie beim vergleichbaren GB200-NVL72-System von Nvidia, erreiche der Cloudmatrix-384-Cluster mit 384 Ascend-910C-Prozessoren eine BF16-Rechenleistung von fast 300 Petaflops. Der Nachfolger Ascend 910D werde derzeit getestet, um die Leistung des H100 zu erreichen oder zu übertreffen. Der im 6-nm-Verfahren gefertigte Ascend 920 soll über 900 Teraflops pro Karte erreichen, sagte er.

"Wir sind ein Unternehmen für KI-Anwendungen, kein Hardwarehersteller. Atoms AI ist ein Tool für intuitives Programmieren, das Menschen dabei hilft, Ideen in reale Produkte umzusetzen. So können beispielsweise Kleinunternehmer und Gründer mit Atoms internen Tools, Landingpages oder automatisierte Workflows erstellen. Atoms-KI-Agenten unterstützen auch technisch weniger versierte Anwender bei der Entwicklung, Markteinführung und Vermarktung ihrer Produkte."

Während sich Hardware- und Modellanbieter auf Rechenleistung, Chips und Modellperformance konzentrierten, liege der Fokus von Wus Firma darauf, diese Fähigkeiten in der Praxis nutzbar zu machen, betonte er.

Wu ist Gründer und CEO von Deep Wisdom und dessen kürzlich eingeführtem Produkt Atoms, das von Openmanus, einem VC-finanzierten KI-Programmier-Start-up, entwickelt wurde. Er ist außerdem Gründer von MetaGPT, und sein Team steht hinter MGX und Foundationagents.org.


Relevante Themen