RISC-V: Viele Kerne machen noch keinen Supercomputer

Italienische Forscher haben einen Cluster-Computer mit 32 Risc-V-Kernen zusammengestellt und vermessen. Der Sinn ist fraglich.

Artikel von Johannes Hiltscher veröffentlicht am
Trotz eigens designtem Aufkleber enttäuschend: Monte Cimone, hier ein System mit acht Knoten
Trotz eigens designtem Aufkleber enttäuschend: Monte Cimone, hier ein System mit acht Knoten (Bild: E4 Computer Engineering)

Ein Hochleistungsrechner auf Basis von Risc-V-Kernen: Dieses zunächst vielversprechende System namens Monte Cimone haben die Universität Bologna, das Supercomputerzentrum Cineca und das auf Hochleistungsrechnen spezialisierte Unternehmen E4 Computer Engineering gemeinsam entwickelt und nun erste Benchmark-Ergebnisse vorgestellt. Diese sind als Vorveröffentlichung (PDF) verfügbar.

Stellenmarkt
  1. Projektmanager CES (m/w / divers)
    Continental AG, Markdorf
  2. Java-Entwickler / Software Developer, z. B. Informatiker / Fachinformatiker (w/m/d)
    emsys VPP GmbH, Oldenburg
Detailsuche

Demnach besteht das System aus vier Rackgehäusen, in dem acht Rechenknoten mit insgesamt 32 Risc-V-Kernen verbaut sind. Erstmals vorgestellt hat E4 das System im Dezember 2021, damals war noch von zwölf Rechenknoten die Rede. Bei näherer Betrachtung ist Monte Cimone allerdings nicht mehr ganz so spektakulär: In jedem Gehäuse sind lediglich zwei Hifive Unmatched verbaut, dazu für jedes ein eigenes 250-W-Netzteil.

Vernetzt werden die einzelnen Boards über die integrierten 1-GBit-Netzwerkadapter. Versuche, Infiniband-Netzwerkkarten zu nutzen, scheiterten dem Paper zufolge. Zwar wurden die Karten vom Linux-Kernel erkannt, Remote Direct Memory Access (RDMA) funktionierte allerdings nicht. Genau das wollten die Forscher allerdings nutzen, um einen effizienteren Datenaustausch bei verteilten Anwendungen zu erreichen.

Die Ergebnisse: ernüchternd

Das Paper enthält auch Benchmark-Ergebnisse, allerdings lediglich von Stream (Speicherbandbreite), High Performace Linpack (HPL) und quantumEspresso (verteilte Anwendung für Elektronenstrukturberechnungen). Vom Ergebnis des Stream-Benchmarks zeigen sich die Forscher selbst enttäuscht, auch beim HPL bleibt der Risc-V-Cluster hinter Vergleichssystemen zurück. Beide liefern zudem nur theoretische Ergebnisse, quantumEspresso ist die einzige reale Anwendung - und deren Ergebnis wird nicht einmal eingeordnet. Auch hier lief nur der Benchmark, keine reale Berechnung.

Golem Karrierewelt
  1. Java EE 8 Komplettkurs: virtueller Fünf-Tage-Workshop
    11.-15.07.2022, virtuell
  2. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    28.06.-01.07.2022, virtuell
Weitere IT-Trainings

Der Schwerpunkt des Papers liegt zwar darauf, den Weg für Risc-V-Hochleistungsrechner zu ebnen. Dafür habe man diverse Management-Software portiert. Das allerdings ist keine große Herausforderung, denn portieren bedeutet hier lediglich: für Risc-V neu kompilieren und gegebenenfalls ein paar Konfigurationsdateien anpassen.

Auch bei den meisten Anwendungen ist die Herausforderung nicht größer, da sie nie auf eine spezielle Architektur ausgelegt sind. Zwar sind optimierte Code-Pfade üblich, es existiert allerdings immer eine Alternative in einer Hochsprache wie Fortran oder C. Und damit genügt neu kompilieren für die Portierung. Der RDMA-Code des Infiniband-Treibers könnte eine Ausnahme sein.

  • So sieht es im Inneren eines Knoten von Monte Cimone aus: Zwei Netzteile und zwei Hifive Unmatched Mini-ITX-Boards. (Bild: E4 Computer Engineering)
So sieht es im Inneren eines Knoten von Monte Cimone aus: Zwei Netzteile und zwei Hifive Unmatched Mini-ITX-Boards. (Bild: E4 Computer Engineering)

Mit dem Raspberry Pi gab es das auch schon

Das System erinnert stark an Supercomputer auf Basis des Raspberry Pi, von denen vor mittlerweile einigen Jahren mehrere vorgestellt wurden. Seitdem ist es, von kleineren Varianten abgesehen, um sie allerdings still geworden - und das aus gutem Grund. Denn für einen Hochleistungsrechner sind die vielen, aber leistungsschwachen Kerne schlicht unattraktiv. Zumindest wenn sie nicht zu Hunderten in einem Chip sitzen.

Der Grund dafür ist, dass die meisten realen Anwendungen recht häufig Daten zwischen den auf den einzelnen Kernen laufenden Anwendungsteilen austauschen. Wenige Anwendungen führen lange, unabhängige Berechnungen durch. Reale Anwendungen hängen stark von der Bandbreite, mit der Daten ausgetauscht werden können, ab. Viele, dafür einfache Rechenkerne können zwar beachtliche Leistungen erreichen und klassische Prozessoren in den Schatten stellen - genau das machen GPUs. Allerdings sind die Kerne dort auf einem Stück Silizium integriert, was enorme Bandbreiten zum Datenaustausch ermöglicht.

Genau aus diesem Grund wurde die Arm-Architektur erst mit Prozessoren wie dem Ampere Altra konkurrenzfähig - und nicht mit hunderten Raspberry Pis. Das Paper zeigt vielmehr, wie weit entfernt aktuelle Risc-V-Prozessoren noch von einem Einsatz im Hochleistungsrechnen sind.

Ein Nutzer kommentierte bei Reddit passend: Beim Stream-Benchmark könne der genutzte U740 nicht einmal mit dem Raspberry Pi 3 mithalten. Hochleistungsrechner mit Risc-V-Architektur sind also noch nicht um die Ecke, und Monte Cimone trägt hier wenig bei - zum selben Ergebnis hätte man am heimischen Schreibtisch kommen können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


jhi (Golem.de) 14. Jun 2022 / Themenstart

Ja, aber wenn man die 32 Kerne in einen Chip packt ist es ja ein anderer Prozessor. Und...

fanreisender 14. Jun 2022 / Themenstart

Ich habe den Namen der Firma vergessen. Ist auch schon in etwa 25 Jahre (oder länger...

Kommentieren



Aktuell auf der Startseite von Golem.de
Klima-Ticket
Bund plant Nachfolger für Neun-Euro-Ticket

Das Neun-Euro-Ticket könnte als Klimaticket weiterlaufen. Das geht aus einem Vorschlag für ein neues Klimaschutzsofortprogramm hervor.

Klima-Ticket: Bund plant Nachfolger für Neun-Euro-Ticket
Artikel
  1. Vitali Klitschko: Zweifel an Giffeys Deepfake-These
    Vitali Klitschko
    Zweifel an Giffeys Deepfake-These

    Die Berliner Staatskanzlei spricht von einem Deepfake beim Gespräch zwischen Bürgermeisterin Franziska Giffey und dem falschen Klitschko. Nun gibt es eine neue These.

  2. Feuerwehr: E-Auto-Brand zerstört Haus - Photovoltaik erschwert Löschen
    Feuerwehr
    E-Auto-Brand zerstört Haus - Photovoltaik erschwert Löschen

    Feuerwehrleute in Hessen hatten Probleme, einen Elektroauto-Brand, der auf ein Wohngebäude übergriff, zu löschen. Auf dem Dach befand sich Photovoltaik.

  3. Studie VW ID.Aero vorgestellt: Elektrischer Passat soll 620 km weit kommen
    Studie VW ID.Aero vorgestellt
    Elektrischer Passat soll 620 km weit kommen

    Nach der elektrischen Kompaktklasse und SUVs legt VW nun mit einer Limousine nach. Die Studie ID.Aero erinnert sehr stark an ein Verbrennermodell.
    Ein Bericht von Friedhelm Greis

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI 32" WQHD 165 Hz günstig wie nie: 399€ • Saturn-Fundgrube: Restposten zu Top-Preisen • MindStar (AMD Ryzen 9 5900X 375€, Gigabyte RX 6900 XT 895€) • Samsung Galaxy Watch 4 Classic 46 mm 205€ [Werbung]
    •  /