Cerebras WSE-2: München verbaut riesigen KI-Chip

Als erster Standort in Europa hat das Leibniz-Rechenzentrum (LRZ) ein CS-2-System mit Cerebras' WSE-2 gekauft, welches effizient und schnell ist.

Artikel veröffentlicht am ,
Die WSE-2 ist wahrlich gigantisch.
Die WSE-2 ist wahrlich gigantisch. (Bild: Cerebras)

Während der SuperMUC-NG in Garching bei München noch darauf wartet, für die Phase 2 mit Intel-Hardware aufgerüstet zu werden, gibt es vor Ort eine andere spannende Neuerung: Im Leibniz-Rechenzentrum steht ab Sommer 2022 ein CS-2, so heißt das System von Cerebras mit der Wafer Scale Engine der zweiten Generation. Das LRZ ist somit der erste wissenschaftliche Standort in Europa, der Zugriff auf ein CS-2 hat.

Stellenmarkt
  1. Spezialistin Supportmanagement (m/w/d)
    Stadtwerke München GmbH, München
  2. Senior SAP Consultant (w/m/d) HCM
    VRG HR GmbH', verschiedene Einsatzorte (Home-Office möglich)
Detailsuche

Das CS-2 ist ein 15U-Rack, in dem eine WSE-2 steckt: Dieser riesige KI-Chip misst tellergroße 46.225 mm² und weist 2,6 Billionen Transistoren auf. Nvidias aktueller GH100 des H100-Beschleunigers mutet mit 814 mm² und 80 Milliarden Transistoren verglichen dazu winzig an. Der Vorteil des CS-2 ist seine immense Rechenleistung bei relativ niedrigen 23 Kilowatt - viel weniger, als ein ähnlich leistungsfähiger Cluster mit GPUs benötigen würde.

"Wir sollten aufhören, in HPC- oder KI-Systemen zu denken"

Hinzu kommt, dass die laufenden Kosten (TCO) reduziert werden, weil weniger Daten hin- und hergeschoben werden müssen; die meisten Operationen können lokal stattfinden. Das CS-2 ist über 8x 100-GBit/s-Ethernet an einen Superdome Flex von HPE angebunden, darin stecken 16 Xeon-CPUs samt 12 TByte RAM. Beide Systeme sind zur Verarbeitung großer Datenmengen und Bewältigung komplexer wissenschaftlicher Fragestellungen ausgelegt.

Vorerst gibt es eine solche Kombination, die in Kürze bereitstehen soll. "Aktuell beobachten wir, dass sich der KI-Rechenbedarf unserer Nutzerinnen und Nutzer alle drei bis vier Monate verdoppelt", sagt Prof. Dr. Dieter Kranzlmüller, Leiter des LRZ. Als Einsatzzwecke nennt das Leibniz-Rechenzentrum unter anderem die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), die medizinische Bildverarbeitung sowie die numerische Strömungsmechanik (Computational Fluid Dynamics, CFD) für Bereiche wie etwa Luft- und Raumfahrttechnik plus Fertigung.

Golem Karrierewelt
  1. Adobe Photoshop Aufbaukurs: virtueller Zwei-Tage-Workshop
    14./15.07.2022, Virtuell
  2. Green IT: Praxisratgeber zur nachhaltigen IT-Nutzung (virtueller Ein-Tages-Workshop)
    10.08.2022, virtuell
Weitere IT-Trainings

Neben künstlicher Intelligenz kann das CS-2 auch für eher klassische HPC-Berechnungen (High Performance Computing) eingesetzt werden, denn: "Wir sollten aufhören, in HPC- oder KI-Systemen zu denken", sagt Laura Schulz, Head of Strategy am LRZ.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Microsoft
Exchange Server von gut versteckter Hintertür betroffen

Sicherheitsforscher haben eine Backdoor gefunden, die zuvor gehackte Exchange-Server seit 15 Monaten zugänglich hält.

Microsoft: Exchange Server von gut versteckter Hintertür betroffen
Artikel
  1. Ayn Loki Zero: Dieses PC-Handheld kostet nur 200 US-Dollar
    Ayn Loki Zero
    Dieses PC-Handheld kostet nur 200 US-Dollar

    Es ist das bisher günstigste Modell in einer Reihe von vielen: Der Loki Zero mit 6-Zoll-Display nutzt einen Athlon-Prozessor mit Vega-Grafik.

  2. Ducati V21L: Ducatis elektrische Rennmaschine schafft 275 km/h
    Ducati V21L
    Ducatis elektrische Rennmaschine schafft 275 km/h

    Ducati testet seit einem halben Jahr ein Elektromotorrad für den Rennsport. Der italienische Hersteller nennt Details zu Leistung und Einsatz.

  3. Autonomes Fahren: Fahrerlose Taxis treffen sich und blockieren eine Kreuzung
    Autonomes Fahren
    Fahrerlose Taxis treffen sich und blockieren eine Kreuzung

    Fahrerlose Autos haben manchmal ihren eigenen Willen und können einen Stau verursachen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte RX 6800 679€ • Samsung SSD 2TB (PS5-komp.) 249,90€ • MindStar (Zotac RTX 3090 1.399€) • Top-Spiele-PC mit AMD Ryzen 7 RTX 3070 Ti 32GB 1.700€ • Nanoleaf günstiger • Alternate (TeamGroup DDR4-3600 16GB 49,99€) Switch OLED günstig wie nie: 333€ [Werbung]
    •  /