Genoa-X, Bergamo und Instinct: AMD stellt neue Epycs und MI300 ohne Zen-Cores vor
AMDs neue Prozessoren und GPU-Beschleuniger sollen Intel und Nvidia ausstechen – mit bis zu 13 Chiplets, 192 GByte HBM-Speicher und 1,1 GByte L3-Cache.
In San Francisco hat AMDs CEO Lisa Su gestern die neuen Prozessoren und Rechenbeschleuniger des Unternehmens vorgestellt – neben bereits Erwartetem war auch eine Neuankündigung dabei: Die Instinct MI300X wird nur mit GPU-Kernen auf den Markt kommen, bislang waren die Beschleuniger als Kombination aus Zen4-Prozessor- und RDNA3-Grafikkernen geplant. Die heißen jetzt MI300A und werden im Exascale-Computer El Capitan, der am Lawrence Livermore National Laboratory (LLNL) gebaut wird, verwendet.
Von der MI300A sollen bereits Testmuster ausgeliefert worden sein, die MI300X soll im dritten Quartal 2023 folgen. Noch 2023 sollen beide Beschleuniger in großen Mengen verfügbar sein. Die Eckdaten nannte AMD bereits im Januar 2023 im Rahmen der CES: 24 Zen4-Kerne und 128 GByte HBM3-Speicher, der mit 8.192 Bit angebunden ist. Auf der Platine sitzen vier Silizium-Interposer, auf denen entweder zwei GPU- oder drei Prozessor-Chiplets montiert sind. MI300X erfordert keine großen Änderungen: AMD tauscht lediglich den CPU-Interposer gegen einen weiteren mit GPU-Chiplets.
Außerdem bekommt MI300X 50 Prozent mehr Speicher, ganze 192 GByte sind verbaut. Die Bandbreite beträgt 5,2 TByte/s, 60 Prozent mehr als bei Nvidias H100. Gedacht ist MI300X für Large Language Models (LLMs), AMD demonstrierte den Beschleuniger mit dem LLM Hugging Face. Dank des großen und schnellen Speichers soll die MI300X Modelle mit bis zu 80 Milliarden Parametern bewältigen. Wie auch Nvidia mit DGX wird AMD ein fertiges Beschleunigermodul anbieten: Auf der Instinct Platform sitzen acht Instinct MI300X, das Modul soll direkt in Betrieb genommen werden können.
Über ein GByte L3-Cache oder 128 Prozessorkerne
Daneben sind die bereits angekündigten Bergamo- und Genoa-X-Epycs nun verfügbar. Erstere sind für Clouddienstleister und Hyperscaler gedacht und basieren auf der Zen4c-Architektur. Die ermöglicht deutlich kleinere Kerne, ohne deren Funktion einzuschränken, AMD bietet allerdings mit dem Epyc 9754S auch ein Modell ohne Simultaneous Multithreading (SMT) an. Verwenden wird sie etwa Facebooks Mutterkonzern Meta.
| Modell | Cores | Threads | TDP (W) | Basistakt (GHz) | Boost-Takt (GHz) | L3-Cache (MByte) | |
|---|---|---|---|---|---|---|---|
| Bergamo | 9754 | 128 | 256 | 360 | 2,25 | 3,1 | 256 |
| Bergamo | 9754S | 128 | 128 | 360 | 2,25 | 3,1 | 256 |
| Bergamo | 9734 | 112 | 224 | 320 | 2,2 | 3,0 | 256 |
| Genoa-X | 9684X | 96 | 192 | 400 | 2,55 | 3,7 | 1.152 |
| Genoa-X | 9384X | 32 | 64 | 320 | 3,1 | 3,9 | 768 |
| Genoa-X | 9184X | 16 | 32 | 320 | 3,55 | 4,2 | 768 |
Die Genoa-X-Modelle mit 3D-Vcache hingegen nutzen weiter Zen4-Chiplets und sind für wissenschaftliches Rechnen oder Ingenieuranwendungen gedacht. Die profitieren häufig sehr stark vom großen Cache der X-Modelle, was AMD anhand von Ansys CFX zeigt (PDF), einer Anwendung zur Strömungssimulation. Ein System mit zwei Epyc 9384X soll um 86 Prozent schneller rechnen als ein vergleichbares Intel-System mit zwei Xeon Platinum 8462Y+. Beide Systeme haben insgesamt 64 Kerne, die Intel-Prozessoren entstammen der aktuellen Generation Sapphire Rapids.
Auch für Genoa-X gibt es bereits einen großen Partner: Microsoft wird sie in der Azure-Cloud anbieten. Die entsprechenden Instanzen heißen HBv4 und HX.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed









