• IT-Karriere:
  • Services:

ML-Processor: ARMs Smartphone-NPU schafft 5 Teraops pro Watt

Der ML-Processor ist, der Name impliziert es bereits, für Machine Learning gedacht: Der Funktionsblock von ARM soll neben CPU/GPU in Smartphone-Chips stecken und dort aufwendige Berechnungen bei hochauflösenden Fotos durchführen oder bei der Entsperrung per Gesicht helfen.

Artikel veröffentlicht am ,
Blockdiagramm des ML-Processors
Blockdiagramm des ML-Processors (Bild: ARM)

Apple hat sie, Huawei hat sie und ARM auch: eine sogenannte NPU (Neural Processing Unit) für die dedizierte Berechnung von künstlicher Intelligenz in Smartphone-Chips. Bei ARM wird der Funktionsblock als ML-Processor bezeichnet, er wurde Anfang 2018 als Teil von Project Trillium vorgestellt. Mittlerweile ist der ML-Processor weiter fortgeschritten, weshalb der britische Entwickler sich ausführlicher zu ihm geäußert hat.

Stellenmarkt
  1. Allianz Deutschland AG, Stuttgart
  2. Freie und Hansestadt Hamburg, Behörde für Stadtentwicklung und Wohnen, Hamburg

In heutigen Smartphones laufen bereits sehr viele Machine-Learning-Algorithmen, die Chips in den meisten Geräten verwenden dafür aber keine dedizierten Funktionsblöcke, sondern schlicht die CPU-Kerne oder die Grafikeinheit und teils den DSP (Digital Signal Processor): Auf niedrigster Ebene sind das Workloads wie das Scheduling von Apps und deren Threads, etwas aufwendiger ist Spracherkennung. Deutlich mehr Rechenleistung ist bei der Sprachsynthese und den heutzutage alltäglichen Fotos sowie Videos erforderlich.

  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
  • Präsentation zum ML-Processor alias NPU (Bild: ARM)
Präsentation zum ML-Processor alias NPU (Bild: ARM)

Gerade wenn diese hochauflösend in 4K- oder 8K-UHD aufgenommen werden, steigt der Rechenaufwand drastisch an, was sich gut bei Instagram zeigt: Der Bokeh-Filter generiert zwar sehr gute Resultate, fordert aber CPU-Kerne und die Grafikeinheit stark, was zulasten der Akkulaufzeit geht. ARM zufolge sind weltweit rund vier Milliarden Smartphones in Benutzung, aber nur 500 Millionen davon hätten eine NPU integriert. Weil die Workloads kontinuierlich fordernder werden, verbauen immer mehr Hersteller einen Funktionsblock für Machine Learning. Selbst multiple CPU-Kerne schaffen kein Teraops an INT8-Leistung, auch eine Grafikeinheit wie eine Mali-G76 kommt nicht auf 2 Teraops.

Bisher ging ARM von 3 Teraops mit INT8-Genauigkeit pro Watt für den ML-Processor aus, durch eine verbesserte Effizienz und Kompression der neuronalen Netze durch den Winograd-Algorithmus sollen es nun über 5 Teraops pro Watt sein. Konkret verwendet ARM bis zu acht Kerne, um so 32 Teraops an Rechenleistung für Inferencing, also das Anwenden bereits trainierter Netze, zu erreichen. Um möglichst viele Daten für mehr Geschwindigkeit lokal vorzuhalten, hat jeder Core gleich wenigstens ein MByte an SRAM zum Puffern. Die Kerne können dabei mehrere Netze parallel bearbeiten - was häufiger der Fall ist - oder aber gemeinsam kohärent an einem rechnen. Ein Beispiel sind extrem hochauflösende Fotos wie 360-Grad-Aufnahmen oder 8K60-Videos.

Der ML-Processor hat eigene Firmware, um bei Anwendungen wie der Entsperrung des Smartphones per Gesicht die notwendigen Daten zu schützen; überdies ist sie mit ARMs Trustzone verknüpft. Der Hersteller betont zudem, dass Sicherheit von mehr als einem IP-Block abhänge und eine System-weite Anpassung von Hardware und Software erfordere. Rein von der physischen Implementierung her, also der Fläche des ML-Processors, sagt ARM, dass die NPU deutlich kompakter sei als ein CPU-Cluster oder eine Grafikeinheit. Das verwundert wenig, denn neben der Leistung pro Watt ist auch die Geschwindigkeit pro Quadratmillimeter eine wichtige Metrik bei jedem Funktionsblock eines Smartphone-Chips.

ARM zufolge ist der ML-Processor auf 16 nm und 7 nm ausgelegt, der RTL-Code für Partner existiert bereits und es gibt multiple Lizenznehmer. Wer das ist und wann deren Designs erscheinen, wollte ARM wie üblich nicht kommentieren. Neben Apple und Huawei hat auch Mediatek eine eigene NPU, wohingegen Qualcomm eine extra Tensor-Einheit im DSP für künstliche Intelligenz entwickelt hat. Wie wichtig eine NPU ist, zeigt Google: Deren Assisstant läuft mittlerweile auf dem Gerät und nicht mehr in der Cloud.

Software-seitig nutzt ARM das eigene NN-Framework, eine Open-Source-Inferencing-Engine. Deren Performance liegt ARM zufolge deutlich über der vieler Partner-Lösungen, egal ob sie von einem Cortex-Kern, einer Mali-GPU oder einer NPU ausgeführt wird. Das NN-Framework werde daher bereits in über 250 Millionen Geräten eingesetzt.

Offenlegung: Golem.de hat auf Einladung von ARM hin am Tech Day in London teilgenommen, die Reisekosten wurden gänzlich von ARM übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. 99,00€ (Bestpreis!)
  2. (aktuell u. a. Sharkoon Shark Zone M51, Astro Gaming C40 TR Gamepad für 169,90€, QPAD MK-95...
  3. (u. a. Tropico 6 - El Prez Edition für 21,99€, Minecraft Xbox One für 5,99€ und Red Dead...
  4. (u. a. Asus VP278H für 125,00€, LG 27UD59-W für 209,00€ und HP Pavilion PC für 989,00€)

Folgen Sie uns
       


Mechwarrior 5 - 8 Minuten Gameplay

In Mechwarrior 5 setzen wir uns einmal mehr in einen tonnenschweren Kampfroboter und schmelzen die gegnerischen Metallungetüme. Zuvor rüsten wir unseren stampfenden Mech aber mit entsprechenden Waffen aus.

Mechwarrior 5 - 8 Minuten Gameplay Video aufrufen
Schräges von der CES 2020: Die Connected-Kartoffel
Schräges von der CES 2020
Die Connected-Kartoffel

CES 2020 Wer geglaubt hat, er hätte schon alles gesehen, musste sich auch dieses Jahr auf der CES eines Besseren belehren lassen. Wir haben uns die Zukunft der Kartoffel angesehen: Sie ist smart.
Ein Bericht von Martin Wolf

  1. Smart Lock Netatmo und Yale zeigen smarte Türschlösser
  2. Eracing Simulator im Hands on Razers Renn-Simulator bringt uns zum Schwitzen
  3. Zu lange Ladezeiten Ford setzt auf Hybridantrieb bei autonomen Taxis

Amazon, Netflix und Sky: Disney bringt 2020 den großen Umbruch beim Videostreaming
Amazon, Netflix und Sky
Disney bringt 2020 den großen Umbruch beim Videostreaming

In diesem Jahr wird sich der Video-Streaming-Markt in Deutschland stark verändern. Der Start von Disney+ setzt Netflix, Amazon und Sky gehörig unter Druck. Die ganz großen Umwälzungen geschehen vorerst aber woanders.
Eine Analyse von Ingo Pakalski

  1. Peacock NBC Universal setzt gegen Netflix auf Gratis-Streaming
  2. Joyn Plus+ Probleme bei der Kündigung
  3. Android TV Magenta-TV-Stick mit USB-Anschluss vergünstigt erhältlich

Kailh-Box-Switches im Test: Besser und lauter geht ein klickender Switch kaum
Kailh-Box-Switches im Test
Besser und lauter geht ein klickender Switch kaum

Wer klickende Tastatur-Switches mag, wird die dunkelblauen Kailh-Box-Schalter lieben: Eine eingebaute Stahlfeder sorgt für zwei satte Klicks pro Anschlag. Im Test merken unsere Finger aber schnell den hohen taktilen Widerstand.
Ein Test von Tobias Költzsch

  1. Keychron K6 Kompakte drahtlose Tastatur mit austauschbaren Switches
  2. Charachorder Schneller tippen als die Tastatur erlaubt
  3. Brydge+ iPad-Tastatur mit Multi-Touch-Trackpad

    •  /