Abo
  • Services:

Cambricon MLU100: Entwickler von Huaweis NPU bringt AI-Beschleuniger

Nach der Integration im Kirin 970 für Huawei-Smartphones hat Cambricon mit dem MLU100 einen selbst entwickelten Beschleuniger für künstliche Intelligenz vorgestellt. Kunden wie Lenovo nutzen den Chip.

Artikel veröffentlicht am ,
MLU100
MLU100 (Bild: Cambricon)

Cambricon hat den MLU100-Chip und eine darauf basierende Beschleunigerkarte für Machine Learning veröffentlicht. Wer das chinesische Startup nicht kennt: Es ist der Entwickler der NPU (Neural Processing Unit alias Cambricon-1A) genannten AI-Hardware im Kirin 970, dem aktuellen Smartphone-SoC von Huawei, die ebenfalls aus China kommt. Die Ankündigung des MLU100 erfolgte bereits Anfang Mai 2018, mittlerweile hat Cambricon aber weitere Details online gestellt, wie Wikichip berichtet.

Stellenmarkt
  1. Rheinische Post Mediengruppe, Düsseldorf
  2. Stadtwerke München GmbH, München

Der MLU100 wird in einem 16-nm-Verfahren bei der TSMC hergestellt, die Abkürzung steht schlicht für Machine Learning Unit. Technische Basis ist die MLUv01-Architektur wie schon beim Cambricon-1A, allerdings mit mehr Recheneinheiten und höherem Takt. Der Chip weist ein PCIe-Gen3-x16-Interface zum Host-System auf, per 256-Bit-Bus für eine Datentransferrate von 102 GByte pro Sekunde sind 16 GByte DDR4-3200 oder 32 GByte DDR4-3200 angebunden.

  • Beschleunigerkarte mit MLU100 (Bild: Cambricon)
  • Beschleunigerkarte mit MLU100 (Bild: Cambricon)
  • Platine mit MLU100 und DDR4 (Bild: Cambricon)
Beschleunigerkarte mit MLU100 (Bild: Cambricon)

Auf einer Beschleunigerkarte eingesetzt läuft der MLU100 im Balanced Mode mit 1 GHz bei 80 Watt und im High Performance Mode mit 1,3 GHz bei 110 Watt. Bei halber Gleitkomma-Genauigkeit (FP16) reicht das für 64 Teraflops und für 83 Teraflops sowie bei 8 Bit Integer für 128 Teraops und 166 Teraops. Zum Vergleich: Nvidias Tesla P4 mit 75 Watt kommt auf 192 GByte/s und 22 Teraops bei 8 Bit Integer. Die Karte hat keine Unterstützung für das FP16-Format. Der MLU100 wird per Neuware-SDK angesprochen, welches typische Frameworks wie Apaches MX-Net, Berkeleys Caffe und Googles Android NN sowie Tensorflow unterstützt. Lenovo will die MLU100-Beschleunigerkarten in den eigenen SR650-Servern nutzen.

Neben dem MLU100 arbeitet Cambricon am MLU200, einem Chip für Training statt für Inferencing. Zudem ist mit Cambricon-1M eine weitere IP für Smarphones gedacht. Sie ist für das 7-nm-Verfahren ausgelegt und dürfte im Kirin 980 von Huawei stecken. Cambricon gibt 2 bis 8 Teraops (INT8) bei 5 Teraops pro Watt an, die Cambricon-1A in der NPU-Implementierung schafft nicht vergleichbare 2 Teraflops (PF16) - also wohl 4 Teraops (INT8).



Anzeige
Top-Angebote
  1. 499€ (Bestpreis!)
  2. 569€ (Bestpreis!)
  3. 64,90€ für Prime-Mitglieder (Vergleichspreis 72,88€)

Folgen Sie uns
       


Reflections Raytracing Demo (RTX 2080 Ti vs. GTX 1080 Ti)

Wir haben die Reflections Raytracing Demo auf einer Nvidia Geforce RTX 2080 Ti und auf einer GTX 1080 Ti ablaufen lassen.

Reflections Raytracing Demo (RTX 2080 Ti vs. GTX 1080 Ti) Video aufrufen
Athlon 200GE im Test: Celeron und Pentium abgehängt
Athlon 200GE im Test
Celeron und Pentium abgehängt

Mit dem Athlon 200GE belebt AMD den alten CPU-Markennamen wieder: Der Chip gefällt durch seine Zen-Kerne und die integrierte Vega-Grafikeinheit, die Intel-Konkurrenz hat dem derzeit preislich wenig entgegenzusetzen.
Ein Test von Marc Sauter

  1. AMD Threadripper erhalten dynamischen NUMA-Modus
  2. HP Elitedesk 705 Workstation Edition Minitower mit AMD-CPU startet bei 680 Euro
  3. Ryzen 5 2600H und Ryzen 7 2800H 45-Watt-CPUs mit Vega-Grafik für Laptops sind da

Galaxy A9 im Hands on: Samsung bietet vier
Galaxy A9 im Hands on
Samsung bietet vier

Samsung erhöht die Anzahl der Kameras bei seinen Smartphones weiter: Das Galaxy A9 hat derer vier, zudem ist auch die restliche Ausstattung nicht schlecht. Aus verkaufspsychologischer Sicht könnte die Einstufung in die A-Mittelklasse bei einem Preis von 600 Euro ein Problem sein.
Ein Hands on von Tobias Költzsch

  1. Auftragsfertiger Samsung startet 7LPP-Herstellung mit EUV
  2. Galaxy A9 Samsung stellt Smartphone mit vier Hauptkameras vor
  3. Galaxy J4+ und J6+ Samsung stellt neue Smartphones im Einsteigerbereich vor

Neuer Echo Dot im Test: Amazon kann doch gute Mini-Lautsprecher bauen
Neuer Echo Dot im Test
Amazon kann doch gute Mini-Lautsprecher bauen

Echo Dot steht bisher für muffigen, schlechten Klang. Mit dem neuen Modell zeigt Amazon, dass es doch gute smarte Mini-Lautsprecher mit dem Alexa-Sprachassistenten bauen kann, die sogar gegen die Konkurrenz von Google ankommen.
Ein Test von Ingo Pakalski


      •  /