Original-URL des Artikels: https://www.golem.de/news/mali-g77-arms-valhall-grafikeinheit-ist-40-prozent-flotter-1905-141466.html    Veröffentlicht: 27.05.2019 06:00    Kurz-URL: https://glm.io/141466

Mali-G77

ARMs Valhall-Grafikeinheit ist 40 Prozent flotter

Valhall- statt Bifrost-Architektur: ARMs Mali-G77 nutzt eine massiv veränderte Technik mit deutlich breiteren Ausführungseinheiten und eine zusätzliche Cache-Stufe. Daher laufen Spiele gleich 40 Prozent flotter und Machine Learning wird gar um 60 Prozent schneller berechnet.

Wenn es um die nordische Mythologie geht, dann sind ARMs GPU-Architekturen immer einen Blick auf Wikipedia wert: Die Technik der neuen Mali-G77 genannten Grafikeinheit wird als Valhall bezeichnet, trägt also den Namen der letzten Ruhestätte für gefallene Krieger. Vor Valhall hatte ARM Bifrost als Basis, wobei diese Regenbogenbrücke das Himmelreich Asgard mit der Erde (Midgard) verbindet, was wiederum die Architektur davor war.

Die für Smartphone-Chips gedachte Mali-G77 folgt auf die Mali-G76 und soll drastische Vorteile bei Leistung, Effizienz und Fläche aufweisen: ARM spricht von einer um 60 Prozent höheren Geschwindigkeit bei Machine Learning sowie von 40 Prozent in Spielen, die Performance pro Quadratmillimeter soll um 30 Prozent steigen und die Effizienz ebenfalls um 30 Prozent. Die Zuwächse seien primär der Architektur zuzuschreiben, weil Chips mit der Mali-G77 wie mit der Mali-G76 in 7-nm-Verfahren produziert werden.

Nach der Mali-G72 und der Mali-G76 hat ARM die grundlegende skalare Architektur erneut stark verändert: Die Mali-G77 nutzt in jedem der Shader-Kerne nur noch eine sogenannte Execution Engine statt drei, dafür sind diese für gleich 16 statt 8 Lanes ausgelegt. Jeder Kern schafft somit 50 Prozent mehr Berechnungen pro Takt und es gibt insgesamt je nach Konfiguration maximal eine Mali-G77-MP16 mit ergo bis zu 16 Shader-Cores. Das Scheduling der Instruktionen für diese erfolgt nun in Hardware statt in Software, was Valhall laut ARM zu einer Compiler-freundlicheren Architektur macht. Wie gehabt wird nur OpenGL und Vulkan unterstützt, aber kein Direct3D.

Jeder Shader-Core umfasst den überarbeiteten Quad-Texture-Mapper, der nun doppelt so viele Texel pro Takt durchschleusen und obendrein FP32/FP16-Formate sowie schneller anisotrop filtern kann. Er ist wie gehabt an den L2-Cache angebunden, die Verbindung zu diesem Puffer wurde jedoch beschleunigt. Am L2 hängt ebenfalls der neue Load-/Store-Cache mit 16 KByte, der die Latenz in der Mali-G77 verringert und vor allem bei Machine Learning und den hier wichtigen Matrix-Multiplikationen drastische Vorteile bringen soll. Der LSC ist laut ARM der Grund für 60 Prozent mehr ML-Geschwindigkeit.

Pro Shader-Core gibt es zwei Execution Units mit je drei ALUs: Die FMA-Einheit (Fused Multiply Add) kümmert sich um FP32, FP16 oder INT8, die CVU (Convert Unit) übernimmt vergleichsweise einfache Operationen und die SPU (Special Function Unit) berechnet unter anderem logarithmische oder trigonometrischen Funktionen. Am Drumherum der Mali-G77 ändert sich wenig: Der L1- und der L2-Cache sind gleich groß und nahezu identisch zu der Mali-G76, das Control Fabric zwischen den Shader Cores bleibt - das Message Fabric innerhalb der Kerne wurde jedoch wie erwartet überarbeitet.

ARM erwartet Systems-on-a-Chip mit der Mali-G77 noch 2019. Die Grafikeinheit kann mit CPU-Kernen wie den ebenfalls neuen Cortex-A77 oder dem ML-Processor, einer NPU (Neural Processing Unit) für Machine Learning, kombiniert werden. Einer der Partner für Mali-G77 plus Cortex-A77 dürfte Huawei für den Kirin 985 sein.

Offenlegung: Golem.de hat auf Einladung von ARM hin am Tech Day in London teilgenommen, die Reisekosten wurden gänzlich von ARM übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.  (ms)


© 1997–2019 Golem.de, https://www.golem.de/