Zum Hauptinhalt Zur Navigation Zur Suche

Skalierung durch Chiplets, neuer Chip alle sechs Monate

Bereits der MTIA 300 besteht aus Chiplets, mit jeder neuen Generation treiben Meta und Broadcom dies allerdings weiter. Die 400er-Generation nutzt zwei Compute-Dies mit Rechenelementen und je vier HBM-Stacks, bei der 500er-Generation werden daraus vier Compute-Dies. Anhand der Daten lässt sich ableiten, dass an jedes Compute-Die drei HBM4e-Stacks angebunden sein dürften.

Bei der Entwicklung der Hardware verfolgt der Konzern einen iterativen Ansatz: Die einzelnen Generationen sind keine kompletten Neu-, sondern Weiterentwicklungen. Das ermöglicht laut Meta eine schnellere Anpassung an die dynamische Entwicklung von KI-Modellen. Ziel ist es, alle sechs Monate einen neuen Beschleuniger in Betrieb nehmen zu können.

So unterstützt der MTIA 400 erstmals 4-Bit-Gleitkommadatentypen (den vom Open Compute Project entwickelten MXFP4), der MTIA 450 baut insbesondere hier die Leistung aus. Das Verhältnis (MX)FP8 zu MXFP4 steigt von 1:2 auf 1:3. Zudem werden nach und nach für KI relevante Beschleuniger integriert, etwa für Softmax-Funktionen oder Flash Attention.

Meta hat andere Schwerpunkte als AMD und Nvidia

Auffällig ist, dass Meta weniger stark auf pure Rechenleistung setzt als AMD und Nvidia. Mit 21 PFlops bei MXFP4 liegt MTIA 450 deutlich hinter den rund 40 PFlops von AMDs MI455X und den 50 PFlops von Nvidias Rubin – wobei Nvidia hier immer Werte für dünnbesetzte Matrizen angibt.

Bei Inferenz, Metas Schwerpunkt, spielt die Rechenleistung auch eine kleinere Rolle, wichtiger ist die Speicherbandbreite. Meta setzt auf Anpassung an die eigenen Bedürfnisse und schnelle Entwicklungszyklen.

Dies wird dadurch begünstigt, dass Meta bei der Infrastruktur konsistent bleibt: Auch MTIA 500 soll für das Scale-up-Netzwerk zwölf 800-GBit-Ethernet-Verbindungen verwenden.

Hierdurch kann die Rechenzentrumsinfrastruktur weiter genutzt werden. Die ist bereits auf Direktwasserkühlung ausgelegt und sollte mit einer mehr als verdoppelten Leistungsaufnahme pro Chip – von 800 W bei MTIA 300 auf 1.700 W bei MTIA 500 – klarkommen.


Relevante Themen