Abo
  • IT-Karriere:

Mali-G77: ARMs Valhall-Grafikeinheit ist 40 Prozent flotter

Valhall- statt Bifrost-Architektur: ARMs Mali-G77 nutzt eine massiv veränderte Technik mit deutlich breiteren Ausführungseinheiten und eine zusätzliche Cache-Stufe. Daher laufen Spiele gleich 40 Prozent flotter und Machine Learning wird gar um 60 Prozent schneller berechnet.

Artikel veröffentlicht am ,
Mali-G77
Mali-G77 (Bild: ARM)

Wenn es um die nordische Mythologie geht, dann sind ARMs GPU-Architekturen immer einen Blick auf Wikipedia wert: Die Technik der neuen Mali-G77 genannten Grafikeinheit wird als Valhall bezeichnet, trägt also den Namen der letzten Ruhestätte für gefallene Krieger. Vor Valhall hatte ARM Bifrost als Basis, wobei diese Regenbogenbrücke das Himmelreich Asgard mit der Erde (Midgard) verbindet, was wiederum die Architektur davor war.

Stellenmarkt
  1. Landkreis Märkisch-Oderland, Seelow
  2. Erwin Hymer Group SE, Bad Waldsee

Die für Smartphone-Chips gedachte Mali-G77 folgt auf die Mali-G76 und soll drastische Vorteile bei Leistung, Effizienz und Fläche aufweisen: ARM spricht von einer um 60 Prozent höheren Geschwindigkeit bei Machine Learning sowie von 40 Prozent in Spielen, die Performance pro Quadratmillimeter soll um 30 Prozent steigen und die Effizienz ebenfalls um 30 Prozent. Die Zuwächse seien primär der Architektur zuzuschreiben, weil Chips mit der Mali-G77 wie mit der Mali-G76 in 7-nm-Verfahren produziert werden.

Nach der Mali-G72 und der Mali-G76 hat ARM die grundlegende skalare Architektur erneut stark verändert: Die Mali-G77 nutzt in jedem der Shader-Kerne nur noch eine sogenannte Execution Engine statt drei, dafür sind diese für gleich 16 statt 8 Lanes ausgelegt. Jeder Kern schafft somit 50 Prozent mehr Berechnungen pro Takt und es gibt insgesamt je nach Konfiguration maximal eine Mali-G77-MP16 mit ergo bis zu 16 Shader-Cores. Das Scheduling der Instruktionen für diese erfolgt nun in Hardware statt in Software, was Valhall laut ARM zu einer Compiler-freundlicheren Architektur macht. Wie gehabt wird nur OpenGL und Vulkan unterstützt, aber kein Direct3D.

  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
  • Präsentation zur Mali-G77 (Bild: ARM)
Präsentation zur Mali-G77 (Bild: ARM)

Jeder Shader-Core umfasst den überarbeiteten Quad-Texture-Mapper, der nun doppelt so viele Texel pro Takt durchschleusen und obendrein FP32/FP16-Formate sowie schneller anisotrop filtern kann. Er ist wie gehabt an den L2-Cache angebunden, die Verbindung zu diesem Puffer wurde jedoch beschleunigt. Am L2 hängt ebenfalls der neue Load-/Store-Cache mit 16 KByte, der die Latenz in der Mali-G77 verringert und vor allem bei Machine Learning und den hier wichtigen Matrix-Multiplikationen drastische Vorteile bringen soll. Der LSC ist laut ARM der Grund für 60 Prozent mehr ML-Geschwindigkeit.

Pro Shader-Core gibt es zwei Execution Units mit je drei ALUs: Die FMA-Einheit (Fused Multiply Add) kümmert sich um FP32, FP16 oder INT8, die CVU (Convert Unit) übernimmt vergleichsweise einfache Operationen und die SPU (Special Function Unit) berechnet unter anderem logarithmische oder trigonometrischen Funktionen. Am Drumherum der Mali-G77 ändert sich wenig: Der L1- und der L2-Cache sind gleich groß und nahezu identisch zu der Mali-G76, das Control Fabric zwischen den Shader Cores bleibt - das Message Fabric innerhalb der Kerne wurde jedoch wie erwartet überarbeitet.

ARM erwartet Systems-on-a-Chip mit der Mali-G77 noch 2019. Die Grafikeinheit kann mit CPU-Kernen wie den ebenfalls neuen Cortex-A77 oder dem ML-Processor, einer NPU (Neural Processing Unit) für Machine Learning, kombiniert werden. Einer der Partner für Mali-G77 plus Cortex-A77 dürfte Huawei für den Kirin 985 sein.

Offenlegung: Golem.de hat auf Einladung von ARM hin am Tech Day in London teilgenommen, die Reisekosten wurden gänzlich von ARM übernommen. Unsere Berichterstattung ist davon nicht beeinflusst und bleibt gewohnt neutral und kritisch. Der Artikel ist, wie alle anderen auf unserem Portal, unabhängig verfasst und unterliegt keinerlei Vorgaben seitens Dritter.



Anzeige
Top-Angebote
  1. (u. a. Smartphones, TVs, Digitalkameras & Tablets reduziert)
  2. 139,99€ (Bestpreis - nach Abzug 20€-Coupon)
  3. 749,00€
  4. 199,00€

ms (Golem.de) 27. Mai 2019

Der Kirin 985 ist schon lange fertig.


Folgen Sie uns
       


HP Pavilion Gaming 15 - Fazit

Das Pavilion Gaming 15 ist für 1.000 Euro ein gut ausgestattetes und durchaus flottes Spiele-Notebook.

HP Pavilion Gaming 15 - Fazit Video aufrufen
Change-Management: Die Zeiten, sie, äh, ändern sich
Change-Management
Die Zeiten, sie, äh, ändern sich

Einen Change zu wollen, gehört heute zum guten Ton in der Unternehmensführung. Doch ein erzwungener Wandel in der Firmenkultur löst oft keine Probleme und schafft sogar neue.
Ein Erfahrungsbericht von Marvin Engel

  1. IT-Jobs Der Amtsschimmel wiehert jetzt agil
  2. MINT Werden Frauen überfördert?
  3. Recruiting Wenn das eigene Wachstum zur Herausforderung wird

IT-Sicherheit: Auch kleine Netze brauchen eine Firewall
IT-Sicherheit
Auch kleine Netze brauchen eine Firewall

Unternehmen mit kleinem Geldbeutel verzichten häufig auf eine Firewall. Das sollten sie aber nicht tun, wenn ihnen die Sicherheit ihres Netzwerks wichtig ist.
Von Götz Güttich

  1. Anzeige Wo Daten wirklich sicher liegen
  2. Erasure Coding Das Ende von Raid kommt durch Mathematik
  3. Endpoint Security IT-Sicherheit ist ein Cocktail mit vielen Zutaten

SSD-Kompendium: AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick
SSD-Kompendium
AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick

Heutige SSDs gibt es in allerhand Formfaktoren mit diversen Anbindungen und Protokollen, selbst der verwendete Speicher ist längst nicht mehr zwingend NAND-Flash. Wir erläutern die Unterschiede und Gemeinsamkeiten der Solid State Drives.
Von Marc Sauter

  1. PM1733 Samsungs PCIe-Gen4-SSD macht die 8 GByte/s voll
  2. PS5018-E18 Phisons PCIe-Gen4-SSD-Controller liefert 7 GByte/s
  3. Ultrastar SN640 Western Digital bringt SSD mit 31 TByte im E1.L-Ruler-Format

    •  /