Mali-G78: ARMs Grafikeinheit nutzt zwei Taktdomänen

Bei der Mali-G78 laufen Tiler und Shader mit unterschiedlichen Frequenzen, zudem wurde ein Rechenwerk viel effizienter.

Artikel von veröffentlicht am
Mali-G78
Mali-G78 (Bild: ARM)

ARM hat auf dem alljährlichen Client Tech Day die Mali-G78 angekündigt, eine Grafikeinheit für Smartphone-Chips. Im Vergleich zur Mali-G77 versprechen die Briten 25 Prozent mehr Performance, vor allem aber wurden clevere Änderungen integriert.

Stellenmarkt
  1. Full Stack Developer (m/w/d) im Bereich Java-Entwicklung
    SG Service IT GmbH, Osnabrück
  2. IT Support Engineer (m/w/d)
    Hirschvogel Holding GmbH, Denklingen
Detailsuche

Die Mali-G78 basiert auf der Valhal-Architektur, welche bei der Mali-G77 die vorherige Bifrost-Technik abgelöst hatte. Die Mali-G78 kann 7 bis 24 Shader-Cluster aufweisen, bei der Mali-G77 ist bei 16 Blöcken bereits Schluss. Bei gleicher Fertigung und gleicher Anzahl an Shader-Clustern soll die Mali-G78 rund 15 Prozent mehr 3D-Leistung pro Quadratmillimeter aufweisen und 15 Prozent effizienter sein; maschinelles Lernen (Inferencing) werde um 15 Prozent beschleunigt.

Zu den Neuerungen der Mali-G78 gehören erstmals zwei Takt/Spannung-Domänen, denn das Top Level und die Shader laufen mit unterschiedlichen Frequenzen zugunsten von mehr Leistung und einer höheren Effizienz. Das Top Level umfasst neben dem L2-Cache und dem Scheduler auch den Tiler, welcher für die Geometrie einer Szene verantwortlich ist.

  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
Präsentation zur Mali-G78 (Bild: ARM)

Bei Szenen mit vielen Polygonen oder wenn etwa bei Inferencing die Bandbreite limitiert, kann das Top Level doppelt so hoch takten wie die Shader oder aber die Rechenkerne laufen mit gedrosselter Frequenz. Je nach Shader-Menge erhöhen die getrennten Takt-Domänen die Leistung um 8 bis 14 Prozent (18 Cluster) oder um 9 bis 15 Prozent (24 Cluster), die Energieaufnahme sinkt laut ARM um 6 bis 13 Prozent.

Golem Akademie
  1. Mobile Device Management mit Microsoft Intune
    22.-23. November 2021, online
  2. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  3. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
Weitere IT-Trainings

Generell ist es laut ARM sinnvoller, die Shader aktiv zu lassen und herunterzutakten, statt sie vom Strom zu trennen. Hintergrund ist, dass Ab- und Einschalten mit einer vergleichsweise hohen Latenz einhergeht. Im Ausführungsteil der Shader-Kerne selbst hat ARM die häufig genutzte FMA-Einheit (Fused Multiply Add) überarbeitet. Bei der Execution Engine der Mali-G77 soll der FMA-Block für durchschnittlich 19 Prozent der Leistungsaufnahme verantwortlich sein, bei der Mali-G78 wurde der Energiebedarf um 30 Prozent reduziert. Die Multipliziereinheit ist neu, zudem sind die FP32- und FP16-Pfade getrennt.

Durch die bessere Wiederverwendung von Daten in den Shader-Caches soll der Bedarf an interner Bandbreite um 22 Prozent reduziert worden sein und abseits der Shader-Cores wurde der Tiler für mehr Durchsatz optimiert. Da ein Draw-Call über mehrere Kacheln hinweg vorliegen kann, gab es hier noch Potenzial. Eine weitere Verbesserung betrifft das Fragment Dependency Tracking: Damit werden Dreiecke verworfen, um die Geschwindigkeit bei späteren Berechnungsschritten zu steigern. Die Granularität wurde auf 4 Threads statt 16 Threads verfeinert.

Neben der Mali-G78 hat ARM noch die Mali-G68 vorgestellt: Diese Grafikeinheit ist technisch identisch, weist jedoch maximal 6 statt 7 bis 24 Shader-Cluster auf. Laut ARM gab es eine entsprechende Nachfrage seitens der Partner für eine solche Sub-Premium-Lösung. Eine Mali-G68-MP6 ist den Briten zufolge ähnlich schnell wie eine Mali-G77-MP7, einen Vergleich zur Mali-G57 konnte der IP-Entwickler nicht liefern. Smartphone-SoCs mit Mali-G78 und Mali-G68 werden für 2021 erwartet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Microsoft
Das nächste große Update für Windows 10 kommt im November

Die Version 21H2 wurde wohl auch wegen Windows 11 etwas nach hinten verschoben. Der Patch soll nun aber im November für Windows 10 kommen.

Microsoft: Das nächste große Update für Windows 10 kommt im November
Artikel
  1. Silence S04: Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt
    Silence S04
    Günstiges Elektroauto mit herausnehmbaren Akku vorgestellt

    Beim Elektroauto Silence S04 kann der Nutzer den Akku selbst wechseln, wenn dieser leergefahren ist.

  2. Arduino und Python: Bastler nimmt Audiokassette als Speichermedium für Retro-PC
    Arduino und Python
    Bastler nimmt Audiokassette als Speichermedium für Retro-PC

    Die Kassette kann nicht nur Lieder speichern, sondern auch Bitmuster. Ein Bastler baut dafür eine Schnittstelle mit 1,5 KBit/s Datenrate.

  3. Bis Ende 2022: VW-Manager müssen wegen Chipkrise Verbrenner fahren
    Bis Ende 2022
    VW-Manager müssen wegen Chipkrise Verbrenner fahren

    2022 werden VWs Manager den Kurs des Unternehmenschefs Herbert Diess nicht fahren können - Elektroautos und Hybride können als Dienstwagen nicht bestellt werden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • AOC CQ32G2SE/BK 285,70€ • Dell Alienware AW2521H 360 Hz 499€ • Corsair Vengeance RGB PRO SL 64-GB-Kit 3600 253,64€ • DeepCool Castle 360EX 109,90€ • Phanteks Glacier One 240MP 105,89€ • Seagate SSDs & HDDs günstiger • Alternate (u. a. Thermaltake Core P3 TG Snow Ed. 121,89€) [Werbung]
    •  /