Manticore: Ja, ein RISC-V-Prozessor mit 4.096 Kernen

Vier kombinierte Chips ergeben eine extrem effiziente RISC-V-CPU, die mit Nvidias Ampere-Topmodell konkurriert.

Artikel veröffentlicht am ,
Design des Manticore-Prozessors
Design des Manticore-Prozessors (Bild: ETH Zürich)

Die ETH Zürich ist bekannt für ihre vielfältigen RISC-V-Designs, der Manticore aber sticht dann doch hervor: Benannt nach dem persischen Fabelwesen weist der Prozessor gleich 4.096 Kerne auf, er ist für Gleitkomma-Berechnungen bei besonders hoher Effizienz ausgelegt. Die Forscher präsentierten den Manticore auf der alljährlichen Technologiekonferenz Hot Chips und zeigten erste Leistungswerte basierend auf einem Prototyp.

Stellenmarkt
  1. IT Software Developer (w/m/d)
    e1 Business Solutions GmbH, Graz
  2. Digital Consultant (m/w/d)
    ORBIT Gesellschaft für Applikations- und Informationssysteme mbH, Bonn
Detailsuche

Manticore soll später einmal aus vier Chiplets bestehen, die miteinander verknüpft sind und wovon jeder Zugriff auf einen eigenen 8 GByte fassenden HBM2-Stapelspeicher hat. Für die Fertigung der Dies will die ETH Zürich das 22FDX-Verfahren von Globalfoundries nutzen, die geplante Fläche pro Chip liegt bei geringen 222 mm². Jedes Die besteht intern aus einem HBM2- und einem PCIe-Gen3-x16-Interface, vier Ariane-RV64G-Kernen für ein Linux-Betriebssystem, satten 27 MByte L2-Cache und vier Quadranten.

Diese Quadranten enthalten die eigentliche Rechenleistung, denn jeder besteht aus 32 Clustern mit je 8 Kernen. Die ETH Zürich verwendet die selbst entworfenen Snitch-Cores (PDF): Das sind winzige RV32G-Kerne mit wenig Kontrolllogik und einer zusätzlichen Gleitkommaeinheit, wobei Stream Semantic Register (SSR) und eine Floating Point Repetition Instruction (FREP) die Effizienz steigern. Jeder Snitch-Core schafft 32 FP- und 16 DP-Flops pro Takt, insgesamt soll der Manticore über 27 Teraflops bei doppelter Genauigkeit (FP64) schaffen.

  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
  • Präsentation zum Manticore-Design (Bild: ETH Zürich)
Präsentation zum Manticore-Design (Bild: ETH Zürich)

Für erste Tests hat die ETH Zürich einen 9 mm² kleinen Manticore-Prototyp mit 22FDX-Fertigung bauen lassen. Er enthält 24 Snitch- und zwei Ariane-Cores sowie immerhin 1,25 MByte L2-Cache. Das reicht bereits für gut 54 Gflops bei FP64 mit über 1 GHz und 188 Gflops pro Watt bei rund 500 MHz.

Golem Akademie
  1. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    13.–16. Dezember 2021, virtuell
  2. Webentwicklung mit React and Typescript: virtueller Fünf-Halbtage-Workshop
    6.–10. Dezember 2021, Virtuell
Weitere IT-Trainings

So schafft es der Manticore, bei der Effizienz selbst an Nvidias Tesla A100 leicht vorbeizuziehen. Dabei ist zu bedenken, dass der Manticore ein 22FDX-Design ist und Nvidia den GA100-Chip der Tesla A100 mit TSMCs N7 fertigen lässt. Bei FP32-Berechnungen für Deep-Neural-Network-Training wie Alexnet, Googlenet oder Resnet zieht der Manticore mit der älteren Tesla V100 gleich.

Als nächster Schritt ist eine Platine mit vier Prototyp-Chiplets geplant, zudem soll das Design mit einem modernen und teureren Finfet-Herstellungsverfahren produziert werden. Die ETH Zürich will sich außerdem Partner suchen, die dabei helfen, ein physisches Interface für DDR- oder HBM-Speicher zu integrieren. In der Frage-und-Antwort-Runde merkten die Forscher jedoch an, dass es für die Universität schwierig sei, an SoC-Bestandteile wie Interconnects heranzukommen.

Tiefergehende Informationen zur offenen Befehlssatzarchitektur RISC-V haben wir in einem eigenen Artikel zusammengefasst.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


rubberduck09 20. Aug 2020

Ist nichtmal ansatzweise für Linux geeignet. Mit 8MB läuft das nämlich schon sehr lange...

ms (Golem.de) 19. Aug 2020

22FDX, steht im zweiten Absatz und auf der ersten Slide.

Mandrake 19. Aug 2020

Es is eine partnerschaft also es hat was von der EU auch drinn: ETH Zürich und Universit...

Mixermachine 19. Aug 2020

Die kleinen Kerne haben wahrscheinlich nicht mal eine MMU für virtuellen Speicher. Linux...

mifritscher 19. Aug 2020

Mich interessieren da halt die Hintergründe der Entscheidung. RAM + Cache dürfte eh schon...



Aktuell auf der Startseite von Golem.de
MS Satoshi
Die abstruse Geschichte des Bitcoin-Kreuzfahrtschiffs

Kryptogeld-Enthusiasten kauften ein Kreuzfahrtschiff und wollten es zum schwimmenden Freiheitsparadies machen. Allerdings scheiterten sie an jeder einzelnen Stelle.
Von Elke Wittich

MS Satoshi: Die abstruse Geschichte des Bitcoin-Kreuzfahrtschiffs
Artikel
  1. Gigafactory Berlin: Tesla verzichtet für Akkufertigung auf staatliche Förderung
    Gigafactory Berlin
    Tesla verzichtet für Akkufertigung auf staatliche Förderung

    Tesla verzichtet für die geplante Akkufertigung in Grünheide bei Berlin auf eine mögliche staatliche Förderung in Milliardenhöhe.

  2. Microsoft: Xbox-Spieler in Halo Infinite von Crossplay genervt
    Microsoft
    Xbox-Spieler in Halo Infinite von Crossplay genervt

    Im Multiplayer von Halo Infinite gibt es offenbar immer mehr Cheater. Nun fordern Xbox-Spieler eine Option, um gemeinsame Partien mit PCs zu vermeiden.

  3. 50 Prozent bei IT-Weiterbildung sparen
     
    50 Prozent bei IT-Weiterbildung sparen

    Die Black Week 2021 in der Golem Karrierewelt läuft weiter: 50 Prozent bei zahlreichen Live-Workshops, Coachings und E-Learnings sparen - noch bis Montag!
    Sponsored Post von Golem Akademie

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Heute ist Black Friday • Corsair MP600 Pro XT 1TB 167,96€ • Apple Watch Series 6 ab 379€ • Boxsets (u. a. Game of Thrones Blu-ray 79,97€) • Samsung Galaxy S21 128GB 777€ • Premium-Laptops (u. a. Lenovo Ideapad 5 Pro 16" 829€) • MS Surface Pro7+ 888€ • Astro Gaming Headsets [Werbung]
    •  /