• IT-Karriere:
  • Services:

Ethos-N78: ARM verdoppelt Geschwindigkeit von KI-Beschleuniger

Mit dem Ethos-N78 will ARM künstliche Intelligenz in Smartphones besser und effizienter machen.

Artikel von veröffentlicht am
Überblick zur Ethos-N78
Überblick zur Ethos-N78 (Bild: ARM)

ARM hat auf dem alljährlichen Client Tech Day den Ethos-N78 vorgestellt, so heißt die nächste Version der Beschleuniger-Einheit für künstliche Intelligenz. Gedacht ist der Ethos-N78 unter anderem als IP-Block für Smartphone-Chips, wo er mit bis zu 10 Teraops eine doppelt so hohe theoretische INT8-Leistung erreichen soll als der Ethos-N77. Zwar wurden noch keine Designs öffentlich damit beworben, laut ARM wurden die Neural Processing Units (NPU) aber an Partner lizenziert.

Stellenmarkt
  1. über duerenhoff GmbH, Raum Düsseldorf
  2. Universität Passau, Passau

Beim Ethos-N78 steigt die Geschwindigkeit von 5 Teraops auf 10 Teraops bei 512 bis 4.096 MAC-Einheiten, hinzu kommen teils drastische Verbesserungen an der zugrundeliegenden Scylla-Architektur. Bei gleicher Anzahl an MACs sowie identischem Takt und derselben Speicherbandbreite soll die Ethos-N78 im Vergleich zur Ethos-N77 zwischen 18 und 40 Prozent schneller sein, im Mittel sind es ARM zufolge 25 Prozent mehr Inference-Ausführungen pro Sekunde.

Weil die Speicherbandbreite bei Inferencing - also dem Ausführen eines bereits trainierten neuronalen Netzes - häufig der limitierende Faktor ist, hat ARM hier angesetzt. Die Ethos-N78 soll 27 bis 55 Prozent weniger MByte pro Inference-Schritt benötigen. Durchschnittlich soll die Reduktion bei 40 Prozent liegen. Hierzu komprimiert die Ethos-N78 die Aktivierungen in Hardware und die Gewichte in Software, beide werden in Hardware dann wieder entpackt. Laut ARM skaliert die Ethos-N78 dabei gut bei der Leistung pro Quadratmillimeter: Die 5,5-fache Performance soll nur die 4,5-fache Fläche benötigen.

  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
  • Präsentation zur Ethos-N78 (Bild: ARM)
Präsentation zur Ethos-N78 (Bild: ARM)

Die Ethos-N78 wird über ARM-NN angesprochen, also AMRs Software Developer Kit für neuronale Netze. Apps kommunizieren für Inferencing mit Googles Android-API, welche wiederum über die ARM-NN den Scheduler in Aktion setzt, der dann die Berechnung im Chip verteilt. Dabei gilt, dass eine NPU bei der Geschwindigkeit und Effizienz einer GPU oder CPU-Kernen überlegen ist. Letztere können allerdings bei Latenz-kritischen Aufgaben einen Vorteil haben. Erste SoC-Designs mit der Ethos-N78 erwartet ARM für 2021.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de
  2. 369,45€ (Bestpreis!)

ms (Golem.de) 27. Mai 2020 / Themenstart

Dein Smartphone ist voll mit System- und generellen Apps, welche Inferencing nutzen.

Kommentieren


Folgen Sie uns
       


DLR Istar vorgestellt - Bericht

Die Falcon 2000LX des DLR hat weltweit einzigartige Eigenschaft: sie kann so tun, als wäre sie ein anderes Flugzeug.

DLR Istar vorgestellt - Bericht Video aufrufen
    •  /