• IT-Karriere:
  • Services:

Cambricon MLU100: Entwickler von Huaweis NPU bringt AI-Beschleuniger

Nach der Integration im Kirin 970 für Huawei-Smartphones hat Cambricon mit dem MLU100 einen selbst entwickelten Beschleuniger für künstliche Intelligenz vorgestellt. Kunden wie Lenovo nutzen den Chip.

Artikel veröffentlicht am ,
MLU100
MLU100 (Bild: Cambricon)

Cambricon hat den MLU100-Chip und eine darauf basierende Beschleunigerkarte für Machine Learning veröffentlicht. Wer das chinesische Startup nicht kennt: Es ist der Entwickler der NPU (Neural Processing Unit alias Cambricon-1A) genannten AI-Hardware im Kirin 970, dem aktuellen Smartphone-SoC von Huawei, die ebenfalls aus China kommt. Die Ankündigung des MLU100 erfolgte bereits Anfang Mai 2018, mittlerweile hat Cambricon aber weitere Details online gestellt, wie Wikichip berichtet.

Stellenmarkt
  1. operational services GmbH & Co. KG, Berlin, Frankfurt am Main, Wolfsburg, Braunschweig, München
  2. EPLAN Software & Service GmbH & Co. KG, Stuttgart

Der MLU100 wird in einem 16-nm-Verfahren bei der TSMC hergestellt, die Abkürzung steht schlicht für Machine Learning Unit. Technische Basis ist die MLUv01-Architektur wie schon beim Cambricon-1A, allerdings mit mehr Recheneinheiten und höherem Takt. Der Chip weist ein PCIe-Gen3-x16-Interface zum Host-System auf, per 256-Bit-Bus für eine Datentransferrate von 102 GByte pro Sekunde sind 16 GByte DDR4-3200 oder 32 GByte DDR4-3200 angebunden.

  • Beschleunigerkarte mit MLU100 (Bild: Cambricon)
  • Beschleunigerkarte mit MLU100 (Bild: Cambricon)
  • Platine mit MLU100 und DDR4 (Bild: Cambricon)
Beschleunigerkarte mit MLU100 (Bild: Cambricon)

Auf einer Beschleunigerkarte eingesetzt läuft der MLU100 im Balanced Mode mit 1 GHz bei 80 Watt und im High Performance Mode mit 1,3 GHz bei 110 Watt. Bei halber Gleitkomma-Genauigkeit (FP16) reicht das für 64 Teraflops und für 83 Teraflops sowie bei 8 Bit Integer für 128 Teraops und 166 Teraops. Zum Vergleich: Nvidias Tesla P4 mit 75 Watt kommt auf 192 GByte/s und 22 Teraops bei 8 Bit Integer. Die Karte hat keine Unterstützung für das FP16-Format. Der MLU100 wird per Neuware-SDK angesprochen, welches typische Frameworks wie Apaches MX-Net, Berkeleys Caffe und Googles Android NN sowie Tensorflow unterstützt. Lenovo will die MLU100-Beschleunigerkarten in den eigenen SR650-Servern nutzen.

Neben dem MLU100 arbeitet Cambricon am MLU200, einem Chip für Training statt für Inferencing. Zudem ist mit Cambricon-1M eine weitere IP für Smarphones gedacht. Sie ist für das 7-nm-Verfahren ausgelegt und dürfte im Kirin 980 von Huawei stecken. Cambricon gibt 2 bis 8 Teraops (INT8) bei 5 Teraops pro Watt an, die Cambricon-1A in der NPU-Implementierung schafft nicht vergleichbare 2 Teraflops (PF16) - also wohl 4 Teraops (INT8).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

Folgen Sie uns
       


Galaxy Fold im Test

Das Galaxy Fold ist Samsungs erstes Smartphone mit faltbarem Display. Die Technologie ist spannend, im Alltag nervt uns das ständige Auf- und Zuklappen aber etwas.

Galaxy Fold im Test Video aufrufen
Netzwerke: Warum 5G nicht das bessere Wi-Fi ist
Netzwerke
Warum 5G nicht das bessere Wi-Fi ist

5G ist mit großen Marketing-Versprechungen verbunden. Doch tatsächlich wird hier mit immensem technischem und finanziellem Aufwand überwiegend das umgesetzt, was Wi-Fi bereits kann - ohne dessen Probleme zu lösen.
Eine Analyse von Elektra Wagenrad

  1. Rechenzentren 5G lässt Energiebedarf stark ansteigen
  2. Hamburg Telekom startet 5G in weiterer Großstadt
  3. Campusnetze Bisher nur sechs Anträge auf firmeneigenes 5G-Netz

Quantencomputer: Intel entwickelt coolen Chip für heiße Quantenbits
Quantencomputer
Intel entwickelt coolen Chip für heiße Quantenbits

Gebaut für eine Kühlung mit flüssigem Helium ist Horse Ridge wohl der coolste Chip, den Intel zur Zeit in Entwicklung hat. Er soll einen Quantencomputer steuern, dessen Qubits mit ungewöhnlich hohen Temperaturen zurechtkommen.
Von Frank Wunderlich-Pfeiffer

  1. AWS re:Invent Amazon Web Services bietet Quanten-Cloud-Dienst an
  2. Quantencomputer 10.000 Jahre bei Google sind 2,5 Tage bei IBM
  3. Google Ein Quantencomputer zeigt, was derzeit geht und was nicht

Echo Dot mit Uhr und Nest Mini im Test: Amazon hängt Google ab
Echo Dot mit Uhr und Nest Mini im Test
Amazon hängt Google ab

Amazon und Google haben ihre kompakten smarten Lautsprecher überarbeitet. Wir haben den Nest Mini mit dem neuen Echo Dot mit Uhr verglichen. Google hat es sichtlich schwer, konkurrenzfähig zu Amazon zu bleiben.
Ein Test von Ingo Pakalski

  1. Digitale Assistenten Amazon verkauft dreimal mehr smarte Lautsprecher als Google
  2. Googles Hardware-Chef Osterloh weist Besuch auf smarte Lautsprecher hin
  3. Telekom Smart Speaker im Test Der smarte Lautsprecher, der mit zwei Zungen spricht

    •  /