Biren BR100/BR104: Chinas GPGPU-Beschleuniger schlägt Nvidias Hopper

Bei der FP32-Leistung macht niemand dem BR100-Chip von Biren etwas vor: Hier gibt es satte 256 Teraflops und 64 GByte HBM2e-Stapelspeicher.

Artikel veröffentlicht am ,
Biren stellt die BR100-GPGPU vor.
Biren stellt die BR100-GPGPU vor. (Bild: Biren)

Biren hat den BR100- und den BR104-Chip vorgestellt (via Videocardz), wobei ersterer quasi eine doppelte Variante von letzterem darstellt. Beide sind für GPGPU-Beschleuniger gedacht, so wie AMDs Instinct- oder Nvidias Tesla-Modelle (die nicht mehr so heißen). Biren Tech ist ein chinesisches Start-up, weshalb die theoretischen Leistungsdaten der beiden Grafikprozessoren ziemlich beeindruckend wirken.

Stellenmarkt
  1. RPA Developer (m/w/d)
    Beurer GmbH, Ulm
  2. Senior Marketing Data Engineer (m/w/d)
    Lidl Digital, Berlin
Detailsuche

Für den BR100 nennt der Hersteller enorme 77 Milliarden Transistoren, was nur drei Milliarden weniger als bei Nvidias Hopper GH100 sind. Weil das chinesische Design in einem 7-nm-Verfahren statt dem 4N-Prozess gefertigt wird, würde es als einzelner Chip das Maskenlimit sprengen. Folgerichtig hat sich Biren für einen Chiplet-Ansatz entschieden: Der BR100 setzt sich aus zwei Dies für 1.072 mm² zusammen.

Performance gleichauf oder höher als bei Nvidia

Bei unbekannter Leistungsaufnahme soll der GPGPU-Beschleuniger auf 256 Teraflops (FP32), 512 Teraflops (TF32) sowie 1.000 Teraflops (BF16) und 2.000 Teraops (INT8) kommen. Nvidias H100-Modell ist mit 60 Teraflops, 500 Teraflops, 1.000 Teraflops und 2.000 Teraops teils langsamer; erst mithilfe der Tensor-Cores ist eine verdoppelte BF16- und INT8-Performance erreichbar.

Damit der BR100-Grafikprozessor genügend Daten zugeführt bekommt, nutzt Biren einen mit 300 MByte riesigen SRAM-Puffer im Chip und externen HBM2e-Stapelspeicher mit 64 GByte für eine Transferrate von 2,3 TByte/s. Das Package wird auf ein 550-Watt-OAM (Open Accelerator Modul) gesetzt, AMDs Instinct MI250X verwendet denselben Formfaktor. Neben PCIe Gen5 unterstützt der BR100 auch den CXL-Interconnect.

  • BR100 als OAM (Bild: Biren)
  • Technische Daten des BR100 (Bild: Biren)
  • Technische Daten des BR104 (Bild: Biren)
BR100 als OAM (Bild: Biren)
Golem Karrierewelt
  1. Adobe Photoshop Aufbaukurs: virtueller Zwei-Tage-Workshop
    06./07.10.2022, Virtuell
  2. Hands-on C# Programmierung: virtueller Zwei-Tage-Workshop
    08./09.11.2022, virtuell
Weitere IT-Trainings

Neben diesem hat Biren mit dem BR104 auch eine Single-Chiplet-Version vorgestellt, die eine halbierte Leistung aufweist und ergo 32 GByte Videospeicher hat. Der BR104 wird als PCIe-Steckkarte mit 300 Watt angeboten, was für einen GPGPU-Beschleuniger in dieser Bauweise typisch ist. Beide Varianten werden über die Birensupa-Software angesteuert, diese unterstützt unter anderem das AI-Framework Paddlepaddle von Baidu.

Wem BR100 und BR104 bekannt vorkommen: Nvidia verwendet für seine GPGPU-Beschleuniger-Chips ebenfalls eine x100-Nomenklatur, etwa GH100 oder GA100. Hinter den x104-Ablegern wie TU104 oder GA104 hingegen verbergen sich Gaming-Modelle, wobei es mit x103 und x102 noch zwei größere Varianten gibt (etwa GA103 und GA104).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Für 44 Milliarden US-Dollar
Musk will Twitter nun doch übernehmen

Tesla-Chef Elon Musk ist nun doch bereit, Twitter für den ursprünglich vereinbarten Preis zu kaufen. Offenbar will er einen Prozess vermeiden.

Für 44 Milliarden US-Dollar: Musk will Twitter nun doch übernehmen
Artikel
  1. Die große Umfrage: Das sind Deutschlands beste IT-Arbeitgeber 2023
    Die große Umfrage
    Das sind Deutschlands beste IT-Arbeitgeber 2023

    Golem.de und Statista haben 23.000 Fachkräfte nach ihrer Arbeit gefragt. Das Ergebnis ist eine Liste der 175 besten Unternehmen für IT-Profis.

  2. Monitoring von Container-Landschaften: Prometheus ist nicht alles
    Monitoring von Container-Landschaften
    Prometheus ist nicht alles

    Betreuer von Kubernetes und Co., die sich nicht ausreichend mit der Thematik beschäftigen, nehmen beim metrikbasierte Monitoring unwissentlich einige Nachteile in Kauf. Eventuell ist es notwendig, den üblichen Tool-Stack zu ergänzen.
    Von Valentin Höbel

  3. Roadmap: CD Projekt kündigt neues Cyberpunk und mehrere Witcher an
    Roadmap
    CD Projekt kündigt neues Cyberpunk und mehrere Witcher an

    Project Polaris wird eine Witcher-Saga, Orion das nächste Cyberpunk 2077 und Hadar etwas ganz Neues: CD Projekt hat seine Pläne vorgestellt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • 3 Spiele für 49€ • Saturn Gutscheinheft • Günstig wie nie: LG OLED 48" 799€, Xbox Elite Controller 2 114,99€, AOC 28" 4K UHD 144 Hz 600,89€, Corsair RGB Midi-Tower 269,90€, Sandisk microSDXC 512GB 39€ • Bis zu 15% im eBay Restore • MindStar (PowerColor RX 6700 XT 489€) [Werbung]
    •  /