• IT-Karriere:
  • Services:

Mali-G76: ARMs Grafikeinheit lernt schneller und tief

Mit der Mali-G76 hat ARM die Architektur seiner Smartphone-Grafik massiv erweitert: Die GPU hat doppelte so viele Ausführungseinheiten pro Block und unterstützt INT8 für Machine Learning. Ein paar entfernte Schwachstellen helfen zudem, 50 Prozent mehr Performance zu erreichen.

Artikel veröffentlicht am ,
Mali-G76
Mali-G76 (Bild: ARM)

ARM hat die Mali-G76 vorgestellt, eine Grafik-IP für Smartphone-Chips. Sie basiert wie die Mali-G71 und die Mali-G72 auf der Bifrost-Architektur, die neue GPU-Technik weist aber einige signifikante Änderungen auf, um konkurrenzfähig zu sein. ARM spricht generell von einer um 50 Prozent höheren Leistung in Spielen, einer verdreifachten Geschwindigkeit bei Machine Learning und einer um 30 Prozent gestiegenen Effizienz.

Stellenmarkt
  1. WILO SE, Dortmund
  2. Universitätsklinikum Tübingen, Tübingen

Die bisherige Mali-G71/G72 verwenden Shader-Cluster, die jeweils vier Kerne vereinen. Schon mit der Mali-G52 für Mittelklasse-Chips hat ARM die Rechenwerke pro Block verdoppelt, die gleiche Überarbeitung wurde nun auch der Mali-G76 spendiert. Weil sich die Shader pro Cluster verdoppeln, hat ARM auch die Anzahl der Textureinheiten verzweifacht, damit das ALU:Tex-Verhältnis gleich bleibt. Die Anzahl der möglichen G76-Cluster liegt bei 20 statt bei 32, was in 480 statt in 384 Rechenkernen resultiert. Die bisher breiteste G72-Implementierung, die in Samsungs Exynos 9810, ist eine MP18-Umsetzung.

Bedingt durch die Design-Änderungen gibt der britische IP-Entwickler an, dass ein G76-Block pro Takt die Leistung zweier G72-Cluster erreicht, dafür aber nur zwei Drittel der Fläche belegt. Weil die Ansteuerungslogik gleich bleibt, steigt so die Rechenleistung massiv an ohne die Chipfläche übermäßig zu vergrößern. Das ist wichtig, da Die-Size und Performance pro mm² eine sehr relevante Metrik im Mobile-Segment darstellen. Eine weitere von der Mali-G52 übernommene Verbesserung ist die Unterstützung von INT8-Operationen für Machine Learning. Die Leistung bei Inferencing soll daher um den Faktor 2,7 steigen.

Kleinere Änderungen bei der Mali-G76 sind unter anderem eine Tiefenpuffer-Optimierung, da der Depth Tile Buffer bei vielen großen Render-Targets ohne MSAA-Nutzung für Daten aus dem Color Buffer verwendet werden kann. Der Tiler nutzt nun einen Out-of-Order- statt einen In-Order-Writeback für Polygone. Das hilft, die Performance bei einem Cache Miss im TLB zu verbessern.

Neben der Mali-G76 hat ARM noch den Mali-V76 vorgestellt, einen Videoprozessor. Der kann 8K-Inhalte bei 60 fps decodieren und 8K bei 30 fps encodieren. Alternativ unterstützt der V76 auch vier 4K60-Streams oder 16 Full-HD-Streams, was für Videowände interessant ist. Er beschleunigt H.264 sowie H.265 und VP9 jeweils mit 10 Bit, nicht aber den kommenden AV1-Codec.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

Proctrap 03. Jun 2018

quasi fertig kommt immer gut für in Silizium gebrannte Codecs "ja äh, also der kann das...

Jbrahms 03. Jun 2018

@ddd: Ähm... nein. Kein weiterer Text notwendig.


Folgen Sie uns
       


Übersetzung mit DeepL - Tutorial

Wir zeigen im Video, wie die Windows-Version des Übersetzungsprogramms DeepL funktioniert.

Übersetzung mit DeepL - Tutorial Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /