• IT-Karriere:
  • Services:

Mali-G78: ARMs Grafikeinheit nutzt zwei Taktdomänen

Bei der Mali-G78 laufen Tiler und Shader mit unterschiedlichen Frequenzen, zudem wurde ein Rechenwerk viel effizienter.

Artikel von veröffentlicht am
Mali-G78
Mali-G78 (Bild: ARM)

ARM hat auf dem alljährlichen Client Tech Day die Mali-G78 angekündigt, eine Grafikeinheit für Smartphone-Chips. Im Vergleich zur Mali-G77 versprechen die Briten 25 Prozent mehr Performance, vor allem aber wurden clevere Änderungen integriert.

Stellenmarkt
  1. TB International GmbH, Ober-Ramstadt
  2. SSI Schäfer Shop GmbH, Betzdorf

Die Mali-G78 basiert auf der Valhal-Architektur, welche bei der Mali-G77 die vorherige Bifrost-Technik abgelöst hatte. Die Mali-G78 kann 7 bis 24 Shader-Cluster aufweisen, bei der Mali-G77 ist bei 16 Blöcken bereits Schluss. Bei gleicher Fertigung und gleicher Anzahl an Shader-Clustern soll die Mali-G78 rund 15 Prozent mehr 3D-Leistung pro Quadratmillimeter aufweisen und 15 Prozent effizienter sein; maschinelles Lernen (Inferencing) werde um 15 Prozent beschleunigt.

Zu den Neuerungen der Mali-G78 gehören erstmals zwei Takt/Spannung-Domänen, denn das Top Level und die Shader laufen mit unterschiedlichen Frequenzen zugunsten von mehr Leistung und einer höheren Effizienz. Das Top Level umfasst neben dem L2-Cache und dem Scheduler auch den Tiler, welcher für die Geometrie einer Szene verantwortlich ist.

  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
Präsentation zur Mali-G78 (Bild: ARM)

Bei Szenen mit vielen Polygonen oder wenn etwa bei Inferencing die Bandbreite limitiert, kann das Top Level doppelt so hoch takten wie die Shader oder aber die Rechenkerne laufen mit gedrosselter Frequenz. Je nach Shader-Menge erhöhen die getrennten Takt-Domänen die Leistung um 8 bis 14 Prozent (18 Cluster) oder um 9 bis 15 Prozent (24 Cluster), die Energieaufnahme sinkt laut ARM um 6 bis 13 Prozent.

Generell ist es laut ARM sinnvoller, die Shader aktiv zu lassen und herunterzutakten, statt sie vom Strom zu trennen. Hintergrund ist, dass Ab- und Einschalten mit einer vergleichsweise hohen Latenz einhergeht. Im Ausführungsteil der Shader-Kerne selbst hat ARM die häufig genutzte FMA-Einheit (Fused Multiply Add) überarbeitet. Bei der Execution Engine der Mali-G77 soll der FMA-Block für durchschnittlich 19 Prozent der Leistungsaufnahme verantwortlich sein, bei der Mali-G78 wurde der Energiebedarf um 30 Prozent reduziert. Die Multipliziereinheit ist neu, zudem sind die FP32- und FP16-Pfade getrennt.

Durch die bessere Wiederverwendung von Daten in den Shader-Caches soll der Bedarf an interner Bandbreite um 22 Prozent reduziert worden sein und abseits der Shader-Cores wurde der Tiler für mehr Durchsatz optimiert. Da ein Draw-Call über mehrere Kacheln hinweg vorliegen kann, gab es hier noch Potenzial. Eine weitere Verbesserung betrifft das Fragment Dependency Tracking: Damit werden Dreiecke verworfen, um die Geschwindigkeit bei späteren Berechnungsschritten zu steigern. Die Granularität wurde auf 4 Threads statt 16 Threads verfeinert.

Neben der Mali-G78 hat ARM noch die Mali-G68 vorgestellt: Diese Grafikeinheit ist technisch identisch, weist jedoch maximal 6 statt 7 bis 24 Shader-Cluster auf. Laut ARM gab es eine entsprechende Nachfrage seitens der Partner für eine solche Sub-Premium-Lösung. Eine Mali-G68-MP6 ist den Briten zufolge ähnlich schnell wie eine Mali-G77-MP7, einen Vergleich zur Mali-G57 konnte der IP-Entwickler nicht liefern. Smartphone-SoCs mit Mali-G78 und Mali-G68 werden für 2021 erwartet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote

Folgen Sie uns
       


Sega Mega Drive (1990) - Golem retro_

Mit Mega-Power sagte Sega 1990 der Konkurrenz den Kampf an. Im Golem retro_ holen wir uns die Spielhalle nach Hause.

Sega Mega Drive (1990) - Golem retro_ Video aufrufen
Open-Source-Mediaplayer: Die Deutschen werden VLC wohl zerstören
Open-Source-Mediaplayer
"Die Deutschen werden VLC wohl zerstören"

Der VideoLAN-Gründer Jean-Baptiste Kempf spricht im Golem.de Interview über Softwarepatente und die Idee, einen Verkehrskegel als Symbol zu verwenden.
Ein Interview von Martin Wolf

  1. 20 Jahre VLC Die beste freie Software begleitet mich seit meiner Kindheit

IT-Unternehmen: Die richtige Software für ein Projekt finden
IT-Unternehmen
Die richtige Software für ein Projekt finden

Am Beginn vieler Projekte steht die Auswahl der passenden Softwarelösung. Das kann man intuitiv machen oder mit endlosen Pro-und-Contra-Listen, optimal ist beides nicht. Ein Praxisbeispiel mit einem Ticketsystem.
Von Markus Kammermeier

  1. Anzeige Was ITler tun können, wenn sich jobmäßig nichts (mehr) tut
  2. IT-Jobs Lohnt sich ein Master in Informatik überhaupt?
  3. Quereinsteiger Mit dem Master in die IT

Macbook Air und Co.: Verlötete SSDs sind eine dumme Idee
Macbook Air und Co.
Verlötete SSDs sind eine dumme Idee

Immer mehr Hersteller verlöten Komponenten in Notebooks. Trotzdem schreiben sie sich Nachhaltigkeit auf die Fahne - welch Ironie.
Ein IMHO von Oliver Nickel

  1. Smartphones und Notebooks Bundesrat fordert bei Elektrogeräten wechselbare Akkus
  2. Umweltschutz Elektroschrott wird immer größeres Problem

    •  /