Mali-G77: ARMs Valhall-Grafikeinheit ist 40 Prozent flotter

Valhall- statt Bifrost-Architektur: ARMs Mali-G77 nutzt eine massiv veränderte Technik mit deutlich breiteren Ausführungseinheiten und eine zusätzliche Cache-Stufe. Daher laufen Spiele gleich 40 Prozent flotter und Machine Learning wird gar um 60 Prozent schneller berechnet.

Artikel veröffentlicht am ,
Mali-G77
Mali-G77 (Bild: ARM)

Wenn es um die nordische Mythologie geht, dann sind ARMs GPU-Architekturen immer einen Blick auf Wikipedia wert: Die Technik der neuen Mali-G77 genannten Grafikeinheit wird als Valhall bezeichnet, trägt also den Namen der letzten Ruhestätte für gefallene Krieger. Vor Valhall hatte ARM Bifrost als Basis, wobei diese Regenbogenbrücke das Himmelreich Asgard mit der Erde (Midgard) verbindet, was wiederum die Architektur davor war.

Stellenmarkt
  1. IT-Systemadministrator (m/w/d) für Projekte und Infrastruktur
    Erzbischöfliches Ordinariat Bamberg, Bamberg
  2. Anwendungsbetreuer (m/w/d) ERP System
    SAUTER Deutschland Sauter-Cumulus GmbH, Freiburg im Breisgau
Detailsuche

Die für Smartphone-Chips gedachte Mali-G77 folgt auf die Mali-G76 und soll drastische Vorteile bei Leistung, Effizienz und Fläche aufweisen: ARM spricht von einer um 60 Prozent höheren Geschwindigkeit bei Machine Learning sowie von 40 Prozent in Spielen, die Performance pro Quadratmillimeter soll um 30 Prozent steigen und die Effizienz ebenfalls um 30 Prozent. Die Zuwächse seien primär der Architektur zuzuschreiben, weil Chips mit der Mali-G77 wie mit der Mali-G76 in 7-nm-Verfahren produziert werden.

Nach der Mali-G72 und der Mali-G76 hat ARM die grundlegende skalare Architektur erneut stark verändert: Die Mali-G77 nutzt in jedem der Shader-Kerne nur noch eine sogenannte Execution Engine statt drei, dafür sind diese für gleich 16 statt 8 Lanes ausgelegt. Jeder Kern schafft somit 50 Prozent mehr Berechnungen pro Takt und es gibt insgesamt je nach Konfiguration maximal eine Mali-G77-MP16 mit ergo bis zu 16 Shader-Cores. Das Scheduling der Instruktionen für diese erfolgt nun in Hardware statt in Software, was Valhall laut ARM zu einer Compiler-freundlicheren Architektur macht. Wie gehabt wird nur OpenGL und Vulkan unterstützt, aber kein Direct3D.

  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
Präsentation zur Mali-G77 (Bild: ARM)

Jeder Shader-Core umfasst den überarbeiteten Quad-Texture-Mapper, der nun doppelt so viele Texel pro Takt durchschleusen und obendrein FP32/FP16-Formate sowie schneller anisotrop filtern kann. Er ist wie gehabt an den L2-Cache angebunden, die Verbindung zu diesem Puffer wurde jedoch beschleunigt. Am L2 hängt ebenfalls der neue Load-/Store-Cache mit 16 KByte, der die Latenz in der Mali-G77 verringert und vor allem bei Machine Learning und den hier wichtigen Matrix-Multiplikationen drastische Vorteile bringen soll. Der LSC ist laut ARM der Grund für 60 Prozent mehr ML-Geschwindigkeit.

Golem Akademie
  1. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  2. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
  3. Online-Sprachkurse mit Golem & Gymglish
    Kurze Lektionen, die funktionieren
Weitere IT-Trainings

Pro Shader-Core gibt es zwei Execution Units mit je drei ALUs: Die FMA-Einheit (Fused Multiply Add) kümmert sich um FP32, FP16 oder INT8, die CVU (Convert Unit) übernimmt vergleichsweise einfache Operationen und die SPU (Special Function Unit) berechnet unter anderem logarithmische oder trigonometrischen Funktionen. Am Drumherum der Mali-G77 ändert sich wenig: Der L1- und der L2-Cache sind gleich groß und nahezu identisch zu der Mali-G76, das Control Fabric zwischen den Shader Cores bleibt - das Message Fabric innerhalb der Kerne wurde jedoch wie erwartet überarbeitet.

ARM erwartet Systems-on-a-Chip mit der Mali-G77 noch 2019. Die Grafikeinheit kann mit CPU-Kernen wie den ebenfalls neuen Cortex-A77 oder dem ML-Processor, einer NPU (Neural Processing Unit) für Machine Learning, kombiniert werden. Einer der Partner für Mali-G77 plus Cortex-A77 dürfte Huawei für den Kirin 985 sein.

Offenlegung: Golem.de hat auf Einladung von ARM hin am Tech Day in London teilgenommen, die Reisekosten wurden gänzlich von ARM übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
DSGVO
Amazon bekommt 746 Millionen Euro Datenschutz-Strafe

Die Strafe gegen Amazon ist die wohl größte jemals von einer europäischen Datenschutzbehörde verhängte Summe. Die Kläger freuen sich.

DSGVO: Amazon bekommt 746 Millionen Euro Datenschutz-Strafe
Artikel
  1. Datenschutz: Stadt verschickt Daten von 13.000 Impfwilligen per E-Mail
    Datenschutz
    Stadt verschickt Daten von 13.000 Impfwilligen per E-Mail

    Statt neuer Öffnungszeiten haben Verantwortliche in Essen persönliche Daten einfach per E-Mail verschickt.

  2. Black Widow: Scarlett Johansson verklagt Disney
    Black Widow
    Scarlett Johansson verklagt Disney

    Scarlett Johansson hat wegen des Veröffentlichungsmodells von Black Widow Klage eingereicht. Disney nennt das Verhalten "herzlos".

  3. VW ID.4 im Test: Schön brav
    VW ID.4 im Test
    Schön brav

    Eine Rakete ist der ID.4 nicht. Dafür bietet das neue E-Auto von VW viel Platz, hält Spur und Geschwindigkeit - und einmal geht es sogar sportlich in die Kurve.
    Ein Test von Werner Pluta

ms (Golem.de) 27. Mai 2019

Der Kirin 985 ist schon lange fertig.



Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Viewsonic XG270QG (WQHD, 165 Hz) 549,99€ • Mega-Marken-Sparen bei MediaMarkt (u. a. Razer) • Saturn: 1 Produkt zahlen, 2 erhalten • Gigabyte X570 AORUS Master 278,98€ + 30€ Cashback • Alternate (u. a. AKRacing Core EX-Wide SE 248,99€) • MMOGA (u. a. Fallout 4 GOTY 9,99€) [Werbung]
    •  /