GPU Max und Gaudi: Intels Beschleuniger holen zu Nvidia auf

Mehr Leistung dank neuen Datentyps: Intels Habana Gaudi 2 holt in einer aktuellen Einreichung zum KI-Benchmark Mlperf zu Nvidias H100 auf. Verglichen mit der Einreichung vom Mai 2023 konnte der KI-Beschleuniger seine Leistung beim Training von GPT3 fast verdoppeln - da er mittlerweile 8-Bit-Gleitkommazahlen unterstützt(öffnet im neuen Fenster) . In den meisten Benchmarks hat allerdings die H100 die Nase deutlich vorn, auch wenn beide mit dem gleichen Datentyp rechnen.
Auch die Datacenter GPU Max 1550 sieht Intel in einem breiten Spektrum von Benchmarks gleichauf oder besser als Nvidias H100. Einige Anwendungen, etwa Lammps, haben gegenüber den letzten Daten leicht zugelegt. Allerdings wird hier in fast allen Fällen die PCIe-Variante der H100 mit 350 Watt Leistungsaufnahme dem 600-Watt-OAM gegenübergestellt. Intels System soll zudem gut skalieren - beim Vergleich von zwei Läufen einer KI zum Identifizieren möglicher neuer Medikamente auf 128 und 256 Knoten des Hochleistungsrechners Aurora erreichte eine KI fast die doppelte Leistung. Für andere Anwendungen können die Zahlen allerdings anders aussehen.
Vierfache KI-Leistung mit Gaudi 3
Im Rahmen der aktuell in Denver stattfindenden Konferenz SC 2023(öffnet im neuen Fenster) kommentierte Intel außerdem Details der Roadmap für Hochleistungsrechner. Im März 2023 hatte das Unternehmen überraschend die geplante nächste Generation seiner GPU, Arbeitstitel Rialto Bridge, gestrichen . Anstatt GPU und CPU auf einem Interposer zu kombinieren, sollen zunächst GPU Max und der KI-Beschleuniger Gaudi zusammengeführt werden.
Intel erwähnt, dass es sich um eine "modulare, Tile-basierte Architektur" handelt. Offen ist bislang, wie GPU und KI-Beschleuniger konvergieren, also ob es sich um getrennte Recheneinheiten handelt. Intel könnte dann Varianten mit unterschiedlichen Schwerpunkten fertigen, wie das Unternehmen es auch für die kommenden Xeons (Granite Rapids und Sierra Forest) plant.





Die einheitliche Architektur wurde bereits im Mai angekündigt , bei einem Pressetermin gab Intel jetzt einen Ausblick auf die Softwareumgebung: Der Übergang von GPU Max oder Habana Gaudi soll für Kunden transparent sein. Dazu werden die beiden Frameworks Oneapi und SynapseAI zusammengeführt. Der Prozess soll bereits vor der Einführung von Falcon Shores - geplant ist die für 2025 - abgeschlossen sein. Intel plant HBM3 als Speicher - auch wenn es nicht explizit erwähnt wird, dürfte HBM3e gemeint sein. HBM4 soll ebenfalls erst 2025 verfügbar sein und könnte damit zu spät kommen.
Davor kommt 2024 mit Gaudi 3 noch eine aktualisierte Version des KI-Beschleunigers. Der besteht aus zwei 5-nm-Chiplets, denen acht HBM3-Stacks zur Seite stehen statt sechs HBM2e-Stacks wie bislang bei Gaudi 2. Gegenüber dem Vorgänger soll Gaudi 3 mit FP16 die vierfache Rechenleistung und 50 Prozent mehr Speicher haben.



