Zum Hauptinhalt Zur Navigation

Angebotsvielfalt für Kunden erheblich erweitert

Doch was hat Nvidia technisch bewogen, in den angeschlagenen Konkurrenten Intel zu investieren? "Nvidia verfolgt künftig einen Co-Design-Ansatz für eine vollständige Systempalette. Neben Grace, das für ARM-basierte Systeme entwickelt wurde, kann das Unternehmen zukünftig auch x86-basierte NVLink-Racks anbieten" , so Thiele. Das erweitere die Angebotsvielfalt für Kunden erheblich. Gleichzeitig reagiere Nvidia auf die Konkurrenz durch AMDs EPYC- und Instinct-Produkte und erleichtere Migrationen innerhalb des Hyperscaler-Standards.

Ein weiterer Schwerpunkt liege auf der Stärkung der Systemintegration. Thiele erklärte: "So ermöglichen speziell entwickelte x86-CPUs mit NVLink im Vergleich zu PCIe 5 eine kohärente und wesentlich schnellere Verbindung zwischen CPU und GPU. Dies eröffnet neue Möglichkeiten für die Parallelisierung großer Modelle über viele GPUs hinweg und steigert zudem die technische Output-Performance. Besonders vorteilhaft wirkt sich das bei modernen Architekturen wie Mixture of Experts oder bei der Entkopplung von Prefill- und Decode-Prozessen in der LLM-Inference aus."

Woher Nvidias Vorsprung bei KI-Beschleunigern rührt

Seinen Vorsprung bei KI-Beschleunigern gegenüber Intel verdanke Nvidia dem Softwareökosystem als "Burggraben" , erklärte Thiele. "Cuda, mit Tools und Bibliotheken, wird seit mehr als 15 Jahren aufgebaut mit gegenwärtig über 4  Millionen Entwicklern. Darüber liegen TensorRT‑LLM oder Triton Inference Server."

Diese Breite senke Portierungskosten, beschleunige Releases und binde Workloads an Nvidia-Hardware. Der Marktführer könne außerdem mit einer aggressiven Roadmap aufwarten und dabei auf "bewährte Architektursprünge verweisen" . Die Chips seien im Betrieb deutlich schneller, effizienter und günstiger geworden. Dokumentierte Sprünge seien zum Beispiel 3,5 Exaflops FP4 Inferenz und 1,2 Exaflops FP8 Training pro NVL144 sowie neue Datenformate wie FP4, die die Total Cost of Ownership (Gesamtbetriebskosten) optimierten.

Rubin sei in der zweiten Hälfte des Jahres 2026 und Rubin Ultra im Jahr 2027 schon "klar verortet. Damit ist klar, wann die nächsten Generationen erscheinen, was Nvidia eine größere Kredibilität auf dem Markt gibt" , sagte Thiele(öffnet im neuen Fenster) .


Relevante Themen