• IT-Karriere:
  • Services:

Mali-G76: ARMs Grafikeinheit lernt schneller und tief

Mit der Mali-G76 hat ARM die Architektur seiner Smartphone-Grafik massiv erweitert: Die GPU hat doppelte so viele Ausführungseinheiten pro Block und unterstützt INT8 für Machine Learning. Ein paar entfernte Schwachstellen helfen zudem, 50 Prozent mehr Performance zu erreichen.

Artikel veröffentlicht am ,
Mali-G76
Mali-G76 (Bild: ARM)

ARM hat die Mali-G76 vorgestellt, eine Grafik-IP für Smartphone-Chips. Sie basiert wie die Mali-G71 und die Mali-G72 auf der Bifrost-Architektur, die neue GPU-Technik weist aber einige signifikante Änderungen auf, um konkurrenzfähig zu sein. ARM spricht generell von einer um 50 Prozent höheren Leistung in Spielen, einer verdreifachten Geschwindigkeit bei Machine Learning und einer um 30 Prozent gestiegenen Effizienz.

Stellenmarkt
  1. ING-DiBa AG, Frankfurt
  2. INSYS MICROELECTRONICS GmbH, Regensburg

Die bisherige Mali-G71/G72 verwenden Shader-Cluster, die jeweils vier Kerne vereinen. Schon mit der Mali-G52 für Mittelklasse-Chips hat ARM die Rechenwerke pro Block verdoppelt, die gleiche Überarbeitung wurde nun auch der Mali-G76 spendiert. Weil sich die Shader pro Cluster verdoppeln, hat ARM auch die Anzahl der Textureinheiten verzweifacht, damit das ALU:Tex-Verhältnis gleich bleibt. Die Anzahl der möglichen G76-Cluster liegt bei 20 statt bei 32, was in 480 statt in 384 Rechenkernen resultiert. Die bisher breiteste G72-Implementierung, die in Samsungs Exynos 9810, ist eine MP18-Umsetzung.

Bedingt durch die Design-Änderungen gibt der britische IP-Entwickler an, dass ein G76-Block pro Takt die Leistung zweier G72-Cluster erreicht, dafür aber nur zwei Drittel der Fläche belegt. Weil die Ansteuerungslogik gleich bleibt, steigt so die Rechenleistung massiv an ohne die Chipfläche übermäßig zu vergrößern. Das ist wichtig, da Die-Size und Performance pro mm² eine sehr relevante Metrik im Mobile-Segment darstellen. Eine weitere von der Mali-G52 übernommene Verbesserung ist die Unterstützung von INT8-Operationen für Machine Learning. Die Leistung bei Inferencing soll daher um den Faktor 2,7 steigen.

Kleinere Änderungen bei der Mali-G76 sind unter anderem eine Tiefenpuffer-Optimierung, da der Depth Tile Buffer bei vielen großen Render-Targets ohne MSAA-Nutzung für Daten aus dem Color Buffer verwendet werden kann. Der Tiler nutzt nun einen Out-of-Order- statt einen In-Order-Writeback für Polygone. Das hilft, die Performance bei einem Cache Miss im TLB zu verbessern.

Neben der Mali-G76 hat ARM noch den Mali-V76 vorgestellt, einen Videoprozessor. Der kann 8K-Inhalte bei 60 fps decodieren und 8K bei 30 fps encodieren. Alternativ unterstützt der V76 auch vier 4K60-Streams oder 16 Full-HD-Streams, was für Videowände interessant ist. Er beschleunigt H.264 sowie H.265 und VP9 jeweils mit 10 Bit, nicht aber den kommenden AV1-Codec.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (u. a. RTX 2080 ROG Strix Gaming Advanced für 699€, RTX 2080 SUPER Dual Evo OC für 739€ und...
  2. täglich neue Deals bei Alternate.de

Proctrap 03. Jun 2018

quasi fertig kommt immer gut für in Silizium gebrannte Codecs "ja äh, also der kann das...

Jbrahms 03. Jun 2018

@ddd: Ähm... nein. Kein weiterer Text notwendig.


Folgen Sie uns
       


E-Trofit elektrifiziert Dieselbusse - Bericht

Die Ingolstädter Firma E-Trofit elektrifiziert Dieselbusse. Golem.de hat sich die Umrüstung vorführen lassen.

E-Trofit elektrifiziert Dieselbusse - Bericht Video aufrufen
Frauen in der IT: Ist Logik von Natur aus Männersache?
Frauen in der IT
Ist Logik von Natur aus Männersache?

Wenn es um die Frage geht, warum es immer noch so wenig Frauen in der IT gibt, kommt früher oder später das Argument, dass Frauen nicht eben zur Logik veranlagt seien. Kann die niedrige Zahl von Frauen in dieser Branche tatsächlich mit der Biologie erklärt werden?
Von Valerie Lux

  1. IT-Jobs Gibt es den Fachkräftemangel wirklich?
  2. Arbeit im Amt Wichtig ist ein Talent zum Zeittotschlagen
  3. IT-Freelancer Paradiesische Zustände

Bosch-Parkplatzsensor im Test: Ein Knöllchen von LoRa
Bosch-Parkplatzsensor im Test
Ein Knöllchen von LoRa

Immer häufiger übernehmen Sensoren die Überwachung von Parkplätzen. Doch wie zuverlässig ist die Technik auf Basis von LoRa inzwischen? Golem.de hat einen Sensor von Bosch getestet und erläutert die Unterschiede zum Parking Pilot von Smart City System.
Ein Test von Friedhelm Greis

  1. Automated Valet Parking Daimler und Bosch dürfen autonom parken
  2. Enhanced Summon Teslas sollen künftig ausparken und vorfahren

Gardena: Open Source, wie es sein soll
Gardena
Open Source, wie es sein soll

Wenn Entwickler mit Zeitdruck nach Lösungen suchen und sich dann für Open Source entscheiden, sollte das anderen als Vorbild dienen, sagen zwei Gardena-Entwickler in einem Vortrag. Der sei auch eine Anleitung dafür, das Management von der Open-Source-Idee zu überzeugen - was auch den Nutzern hilft.
Ein Bericht von Sebastian Grüner

  1. Linux-Kernel Machine-Learning allein findet keine Bugs
  2. KernelCI Der Linux-Kernel bekommt einheitliche Test-Umgebung
  3. Linux-Kernel Selbst Google ist unfähig, Android zu pflegen

    •  /