Biren BR100/BR104: Chinas GPGPU-Beschleuniger schlägt Nvidias Hopper

Biren hat den BR100- und den BR104-Chip vorgestellt (via Videocardz(öffnet im neuen Fenster) ), wobei ersterer quasi eine doppelte Variante von letzterem darstellt. Beide sind für GPGPU-Beschleuniger gedacht, so wie AMDs Instinct- oder Nvidias Tesla-Modelle (die nicht mehr so heißen). Biren Tech ist ein chinesisches Start-up, weshalb die theoretischen Leistungsdaten der beiden Grafikprozessoren ziemlich beeindruckend wirken.
Für den BR100 nennt der Hersteller enorme 77 Milliarden Transistoren, was nur drei Milliarden weniger als bei Nvidias Hopper GH100 sind. Weil das chinesische Design in einem 7-nm-Verfahren statt dem 4N-Prozess gefertigt wird, würde es als einzelner Chip das Maskenlimit sprengen. Folgerichtig hat sich Biren für einen Chiplet-Ansatz entschieden: Der BR100 setzt sich aus zwei Dies für 1.072 mm² zusammen.
Performance gleichauf oder höher als bei Nvidia
Bei unbekannter Leistungsaufnahme soll der GPGPU-Beschleuniger auf 256 Teraflops (FP32), 512 Teraflops (TF32) sowie 1.000 Teraflops (BF16) und 2.000 Teraops (INT8) kommen. Nvidias H100-Modell ist mit 60 Teraflops, 500 Teraflops, 1.000 Teraflops und 2.000 Teraops teils langsamer; erst mithilfe der Tensor-Cores ist eine verdoppelte BF16- und INT8-Performance erreichbar.
Damit der BR100-Grafikprozessor genügend Daten zugeführt bekommt, nutzt Biren einen mit 300 MByte riesigen SRAM-Puffer im Chip und externen HBM2e-Stapelspeicher mit 64 GByte für eine Transferrate von 2,3 TByte/s. Das Package wird auf ein 550-Watt-OAM (Open Accelerator Modul) gesetzt, AMDs Instinct MI250X verwendet denselben Formfaktor. Neben PCIe Gen5 unterstützt der BR100 auch den CXL-Interconnect.



Neben diesem hat Biren mit dem BR104 auch eine Single-Chiplet-Version vorgestellt, die eine halbierte Leistung aufweist und ergo 32 GByte Videospeicher hat. Der BR104 wird als PCIe-Steckkarte mit 300 Watt angeboten, was für einen GPGPU-Beschleuniger in dieser Bauweise typisch ist. Beide Varianten werden über die Birensupa-Software angesteuert, diese unterstützt unter anderem das AI-Framework Paddlepaddle von Baidu.
Wem BR100 und BR104 bekannt vorkommen: Nvidia verwendet für seine GPGPU-Beschleuniger-Chips ebenfalls eine x100-Nomenklatur, etwa GH100 oder GA100. Hinter den x104-Ablegern wie TU104 oder GA104 hingegen verbergen sich Gaming-Modelle, wobei es mit x103 und x102 noch zwei größere Varianten gibt (etwa GA103 und GA104).



