Suche

AMD Instinct MI300: 13 Chiplets und 146 Milliarden Transistoren für 2 Exaflops

In AMDs erster HPC-APU rechnen 24 CPU-Kerne, die KI-Leistung soll auf Faktor 8 steigen. Die Geräte sollen im Supercomputer zusammen 2 Exaflops liefern.

Artikel veröffentlicht am ,
Die MI300 bestehen aus 146 Milliarden Transistoren. (Bild: AMD)

Nach zahlreichen Vorankündigungen hat Hardwarehersteller AMD erstmals wichtige Details und Spezifikationen zu den kommenden Instinct MI300 bestätigt. Der für Supercomputer gedachte Chip wird von AMD als HPC-APU bezeichnet und besteht aus 13 Chiplets, die teils gestapelt werden (3D-Stacking). Mit den MI300 wird der Supercomputer El Capitan vom Lawrence Livermore National Laboratory (LLNL) ausgestattet, dessen Bau noch in diesem Jahr beginnen soll. Zielvorgabe der Leistung: mehr als 2 Exaflops und damit der schnellste Supercomputer der Welt sein.

Anzeige

Für die Instinct MI300 verwendet AMD 24 CPU-Kerne der Zen4-Architektur, die auch in den Genoa Epyc-9004 stecken. Auf Renderings des Chips sind zwei CPU-Chiplets zu erkennen, woraus sich ergibt, dass AMD offenbar auf teilaktivierte CPU-Cluster setzt statt auf einen Vollausbau mit 32 möglichen CPU-Kernen.

AMD kombiniert die CPUs mit CDNA3-Beschleuniger-Einheiten, zu denen weiter kaum technische Details bekannt sind. Dies ist ein für die HPC-Beschleuniger bisher ungewöhnlicher Ansatz, setzen diese doch meist nicht auf CPU-Kerne im gleichen Package. Mit Grace und Hopper ist Nvidia aber inzwischen bei der kombinierten CPU/GPU-Nutzung auf einem Modul angelangt, das im ersten Halbjahr 2023 bereit stehen soll. Auch Intels für 2024 geplante Falcon Shore HPC-Chips sollen solch einen kombinierten Ansatz nutzen. AMDs MI300 sollen im zweiten Halbjahr 2023 ausgeliefert werden, pünktlich zum Bau des El Capitan.

Massiv gesteigerte Leistung

AMD wiederholt für den MI300-Chip, dass die Leistung dieses gleich um Faktor 5 pro Watt ansteigen soll, bezogen auf KI-Berechnungen im Vergleich zu den MI250. Darüber hinaus soll die Gesamtleistung der MI300 in KI-Anwendungen im Vergleich zu den Vorgängern um Faktor 8 steigen, was AMD nun erstmals ankündigt. Die TDP der MI300 dürfte mit Bezug auf die gemachten Leistungsangaben und im Vergleich zu den MI250 bei 900 Watt liegen. Wie The Next Plattform vorrechnet, könnten zu der gesteigerten Leistung auch die verbesserten Gleitkommaeinheiten in den CPU-Kernen beitragen.

Anzeige

AMD-CEO Lisa Su mit einem MI300. (Bild: AMD) [1/1]

Genutzt werden für den Chip zudem 128 GByte HMB3-Speicher, die über ein riesiges 8.192-Bit breites Unified-Memory-Interface angebunden werden. Das heißt, CPU-Kerne und Compute-Einheiten teilen sich gemeinsamen Speicher, bisher waren diese getrennt. Zum Vergleich: Nvidias Grace-Hopper-Kombination nutzt weiter kohärenten, aber physisch getrennten Speicher. Der Ansatz von AMD dürfte die Leistung des Systems also deutlich steigern, da Datenzugriffe beschleunigt werden. Darüber hinaus soll es leichter werden, Software für den Chip zu programmieren. Der gesamte Chip kommt laut AMD auf zusammen riesige 146 Milliarden Transistoren.