• IT-Karriere:
  • Services:

Mali-G78: ARMs Grafikeinheit nutzt zwei Taktdomänen

Bei der Mali-G78 laufen Tiler und Shader mit unterschiedlichen Frequenzen, zudem wurde ein Rechenwerk viel effizienter.

Artikel von veröffentlicht am
Mali-G78
Mali-G78 (Bild: ARM)

ARM hat auf dem alljährlichen Client Tech Day die Mali-G78 angekündigt, eine Grafikeinheit für Smartphone-Chips. Im Vergleich zur Mali-G77 versprechen die Briten 25 Prozent mehr Performance, vor allem aber wurden clevere Änderungen integriert.

Stellenmarkt
  1. ADG Apotheken-Dienstleistungsgesellschaft mbH, Mannheim
  2. Bundesministerium für wirtschaftliche Zusammenarbeit und Entwicklung, Berlin

Die Mali-G78 basiert auf der Valhal-Architektur, welche bei der Mali-G77 die vorherige Bifrost-Technik abgelöst hatte. Die Mali-G78 kann 7 bis 24 Shader-Cluster aufweisen, bei der Mali-G77 ist bei 16 Blöcken bereits Schluss. Bei gleicher Fertigung und gleicher Anzahl an Shader-Clustern soll die Mali-G78 rund 15 Prozent mehr 3D-Leistung pro Quadratmillimeter aufweisen und 15 Prozent effizienter sein; maschinelles Lernen (Inferencing) werde um 15 Prozent beschleunigt.

Zu den Neuerungen der Mali-G78 gehören erstmals zwei Takt/Spannung-Domänen, denn das Top Level und die Shader laufen mit unterschiedlichen Frequenzen zugunsten von mehr Leistung und einer höheren Effizienz. Das Top Level umfasst neben dem L2-Cache und dem Scheduler auch den Tiler, welcher für die Geometrie einer Szene verantwortlich ist.

  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G78 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
  • Präsentation zur Mali-G68 (Bild: ARM)
Präsentation zur Mali-G78 (Bild: ARM)

Bei Szenen mit vielen Polygonen oder wenn etwa bei Inferencing die Bandbreite limitiert, kann das Top Level doppelt so hoch takten wie die Shader oder aber die Rechenkerne laufen mit gedrosselter Frequenz. Je nach Shader-Menge erhöhen die getrennten Takt-Domänen die Leistung um 8 bis 14 Prozent (18 Cluster) oder um 9 bis 15 Prozent (24 Cluster), die Energieaufnahme sinkt laut ARM um 6 bis 13 Prozent.

Generell ist es laut ARM sinnvoller, die Shader aktiv zu lassen und herunterzutakten, statt sie vom Strom zu trennen. Hintergrund ist, dass Ab- und Einschalten mit einer vergleichsweise hohen Latenz einhergeht. Im Ausführungsteil der Shader-Kerne selbst hat ARM die häufig genutzte FMA-Einheit (Fused Multiply Add) überarbeitet. Bei der Execution Engine der Mali-G77 soll der FMA-Block für durchschnittlich 19 Prozent der Leistungsaufnahme verantwortlich sein, bei der Mali-G78 wurde der Energiebedarf um 30 Prozent reduziert. Die Multipliziereinheit ist neu, zudem sind die FP32- und FP16-Pfade getrennt.

Durch die bessere Wiederverwendung von Daten in den Shader-Caches soll der Bedarf an interner Bandbreite um 22 Prozent reduziert worden sein und abseits der Shader-Cores wurde der Tiler für mehr Durchsatz optimiert. Da ein Draw-Call über mehrere Kacheln hinweg vorliegen kann, gab es hier noch Potenzial. Eine weitere Verbesserung betrifft das Fragment Dependency Tracking: Damit werden Dreiecke verworfen, um die Geschwindigkeit bei späteren Berechnungsschritten zu steigern. Die Granularität wurde auf 4 Threads statt 16 Threads verfeinert.

Neben der Mali-G78 hat ARM noch die Mali-G68 vorgestellt: Diese Grafikeinheit ist technisch identisch, weist jedoch maximal 6 statt 7 bis 24 Shader-Cluster auf. Laut ARM gab es eine entsprechende Nachfrage seitens der Partner für eine solche Sub-Premium-Lösung. Eine Mali-G68-MP6 ist den Briten zufolge ähnlich schnell wie eine Mali-G77-MP7, einen Vergleich zur Mali-G57 konnte der IP-Entwickler nicht liefern. Smartphone-SoCs mit Mali-G78 und Mali-G68 werden für 2021 erwartet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. 98,45€ (mit 14€ Direktabzug - Bestpreis!)
  2. 51,90€ (Bestpreis!)
  3. (u. a. Kingston Traveller USB-Stick 128GB für 9,99€, MS Office 365 Personal für 51,19€, MSI...
  4. (u. a. Philips Ambilight 65OLED804 für 1.899€, Philips Ambilight 65OLED934/12 OLED+ für 2...

Folgen Sie uns
       


Drohnenflug am Strand mit Google Earth Studio - Tutorial

Wir zeigen im kurzen Tutorial, wie man in Earth Studio eine einfache Animation erstellt.

Drohnenflug am Strand mit Google Earth Studio - Tutorial Video aufrufen
Energiewende: Schafft endlich das Brennstoffzellenauto ab!
Energiewende
Schafft endlich das Brennstoffzellenauto ab!

Sie sind teurer und leistungsschwächer als E-Autos und brauchen dreimal so viel Strom. Der Akku hat gewonnen. Wasserstoff sollte für Chemie benutzt werden.
Ein IMHO von Frank Wunderlich-Pfeiffer

  1. Hyundai Nexo Wasserdampf im Rückspiegel
  2. Brennstoffzellenauto Bayern will 100 Wasserstofftankstellen bauen
  3. Elektromobilität Daimler und Volvo wollen Brennstoffzellen für Lkw entwickeln

Echo Auto im Test: Tolle Sprachsteuerung und neue Alexa-Funktionen
Echo Auto im Test
Tolle Sprachsteuerung und neue Alexa-Funktionen

Im Auto ist die Alexa-Sprachsteuerung noch praktischer als daheim. Amazon hat bei Echo Auto die wichtigsten Einsatzzwecke im Fahrzeug bedacht.
Ein Test von Ingo Pakalski

  1. Echo Auto Amazon bringt Alexa für 60 Euro ins Auto
  2. Echo Flex mit zwei Modulen im Test Gut gedacht, mäßig gemacht
  3. Amazon Zahlreiche Echo-Modelle nicht mehr bis Weihnachten lieferbar

Materiejets aus schwarzem Loch: Schneller als das Licht?
Materiejets aus schwarzem Loch
Schneller als das Licht?

Das schwarze Loch stößt Materie mit einer Geschwindigkeit aus, die wie Überlichtgeschwindigkeit aussieht.
Ein Bericht von Andreas Lutter

  1. Oumuamua Ein ganz normal merkwürdiger interstellarer Asteroid

    •  /