Mali-G77: ARMs Valhall-Grafikeinheit ist 40 Prozent flotter

Valhall- statt Bifrost-Architektur: ARMs Mali-G77 nutzt eine massiv veränderte Technik mit deutlich breiteren Ausführungseinheiten und eine zusätzliche Cache-Stufe. Daher laufen Spiele gleich 40 Prozent flotter und Machine Learning wird gar um 60 Prozent schneller berechnet.

Artikel veröffentlicht am ,
Mali-G77
Mali-G77 (Bild: ARM)

Wenn es um die nordische Mythologie geht, dann sind ARMs GPU-Architekturen immer einen Blick auf Wikipedia wert: Die Technik der neuen Mali-G77 genannten Grafikeinheit wird als Valhall bezeichnet, trägt also den Namen der letzten Ruhestätte für gefallene Krieger. Vor Valhall hatte ARM Bifrost als Basis, wobei diese Regenbogenbrücke das Himmelreich Asgard mit der Erde (Midgard) verbindet, was wiederum die Architektur davor war.

Stellenmarkt
  1. Partner & Business Operations Manager (w/m/d) OZG-Umsetzung
    HanseVision GmbH, Hamburg
  2. Mitarbeiter im Service Desk (m/w/d)
    Techniklotsen GmbH, Bielefeld
Detailsuche

Die für Smartphone-Chips gedachte Mali-G77 folgt auf die Mali-G76 und soll drastische Vorteile bei Leistung, Effizienz und Fläche aufweisen: ARM spricht von einer um 60 Prozent höheren Geschwindigkeit bei Machine Learning sowie von 40 Prozent in Spielen, die Performance pro Quadratmillimeter soll um 30 Prozent steigen und die Effizienz ebenfalls um 30 Prozent. Die Zuwächse seien primär der Architektur zuzuschreiben, weil Chips mit der Mali-G77 wie mit der Mali-G76 in 7-nm-Verfahren produziert werden.

Nach der Mali-G72 und der Mali-G76 hat ARM die grundlegende skalare Architektur erneut stark verändert: Die Mali-G77 nutzt in jedem der Shader-Kerne nur noch eine sogenannte Execution Engine statt drei, dafür sind diese für gleich 16 statt 8 Lanes ausgelegt. Jeder Kern schafft somit 50 Prozent mehr Berechnungen pro Takt und es gibt insgesamt je nach Konfiguration maximal eine Mali-G77-MP16 mit ergo bis zu 16 Shader-Cores. Das Scheduling der Instruktionen für diese erfolgt nun in Hardware statt in Software, was Valhall laut ARM zu einer Compiler-freundlicheren Architektur macht. Wie gehabt wird nur OpenGL und Vulkan unterstützt, aber kein Direct3D.

  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
Präsentation zur Mali-G77 (Bild: ARM)

Jeder Shader-Core umfasst den überarbeiteten Quad-Texture-Mapper, der nun doppelt so viele Texel pro Takt durchschleusen und obendrein FP32/FP16-Formate sowie schneller anisotrop filtern kann. Er ist wie gehabt an den L2-Cache angebunden, die Verbindung zu diesem Puffer wurde jedoch beschleunigt. Am L2 hängt ebenfalls der neue Load-/Store-Cache mit 16 KByte, der die Latenz in der Mali-G77 verringert und vor allem bei Machine Learning und den hier wichtigen Matrix-Multiplikationen drastische Vorteile bringen soll. Der LSC ist laut ARM der Grund für 60 Prozent mehr ML-Geschwindigkeit.

Golem Akademie
  1. Microsoft Dynamics 365 Guides mit HoloLens 2: virtueller Ein-Tages-Workshop
    16. Februar 2022, Virtuell
  2. Unity Basiswissen: virtueller Drei-Tage-Workshop
    7.–9. Februar 2022, Virtuell
Weitere IT-Trainings

Pro Shader-Core gibt es zwei Execution Units mit je drei ALUs: Die FMA-Einheit (Fused Multiply Add) kümmert sich um FP32, FP16 oder INT8, die CVU (Convert Unit) übernimmt vergleichsweise einfache Operationen und die SPU (Special Function Unit) berechnet unter anderem logarithmische oder trigonometrischen Funktionen. Am Drumherum der Mali-G77 ändert sich wenig: Der L1- und der L2-Cache sind gleich groß und nahezu identisch zu der Mali-G76, das Control Fabric zwischen den Shader Cores bleibt - das Message Fabric innerhalb der Kerne wurde jedoch wie erwartet überarbeitet.

ARM erwartet Systems-on-a-Chip mit der Mali-G77 noch 2019. Die Grafikeinheit kann mit CPU-Kernen wie den ebenfalls neuen Cortex-A77 oder dem ML-Processor, einer NPU (Neural Processing Unit) für Machine Learning, kombiniert werden. Einer der Partner für Mali-G77 plus Cortex-A77 dürfte Huawei für den Kirin 985 sein.

Offenlegung: Golem.de hat auf Einladung von ARM hin am Tech Day in London teilgenommen, die Reisekosten wurden gänzlich von ARM übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Lego Star Wars UCS AT-AT aufgebaut
"Das ist kein Mond, das ist ein Lego-Modell"

Ganz wie der Imperator es wünscht: Der Lego UCS AT-AT ist riesig und imposant - und eines der besten Star-Wars-Modelle aus Klemmbausteinen.
Ein Praxistest von Oliver Nickel

Lego Star Wars UCS AT-AT aufgebaut: Das ist kein Mond, das ist ein Lego-Modell
Artikel
  1. Kryptowährung im Fall: Bitcoin legt rasante Talfahrt hin
    Kryptowährung im Fall
    Bitcoin legt rasante Talfahrt hin

    Am Samstag setzte sich der Absturz des Bitcoin fort. Ein Bitcoin ist nur noch 34.200 US-Dollar wert. Auch andere Kryptowährungen machen Verluste.

  2. eStream: Airstream-Wohnwagen mit eigenem Elektroantrieb
    eStream
    Airstream-Wohnwagen mit eigenem Elektroantrieb

    Der Wohnwagen Airstream eStream besitzt einen eigenen Elektroantrieb nebst Akku. Das entlastet das Zugfahrzeug und eröffnet weitere Möglichkeiten.

  3. Andromeda: Dieses Microsoft-Smartphone-Betriebssystem erschien nie
    Andromeda
    Dieses Microsoft-Smartphone-Betriebssystem erschien nie

    Erstmals ist ein Blick auf Andromeda möglich - das Smartphone-Betriebssystem, das Microsoft bereits vor einigen Jahren eingestellt hat.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MediaMarkt & Saturn: Heute alle Produkte versandkostenfrei • Corsair Vengeance RGB RT 16-GB-Kit DDR4-4000 114,90€ • Alternate (u.a. DeepCool AS500 Plus 61,89€) • Acer XV282K UHD/144 Hz 724,61€ • MindStar (u.a. be quiet! Pure Power 11 CM 600W 59€) • Sony-TVs heute im Angebot [Werbung]
    •  /