Mali-G72: ARMs Grafikeinheit für Deep-Learning-Smartphones

Die Mali-G72 ist eine GPU für SoCs. Die Bifrost-Architektur von ARM enthält Verbesserungen für VR-Headsets und eine effizientere FP16-Berechnung für Inferencing auf dem Smartphone. Trotz wie gehabt 32 Kernen soll die Leistung um 40 Prozent steigen.

Artikel veröffentlicht am ,
Mali-G72
Mali-G72 (Bild: ARM)

ARM hat die Mali-G72 präsentiert, eine neue GPU für Systems-on-a-Chip (SoC). Die auf dem Tech Day des britischen Entwicklers näher erläuterte Grafikeinheit nutzt wie die vorherige Mali-G71 die neue Bifrost-Architektur, weist aber allerhand überarbeitete Einheiten auf und unterstützt neue Funktionen. Gedacht ist sie für SoCs, die in künftigen Top-Smartphones und VR-Headsets wie den kommenden Google-Daydream-Modellen stecken werden.

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Laut Hersteller weist die Mali-G72-GPU weiterhin bis zu 32 Kerne auf, wobei die meisten Partner auf MP8- oder MP16-Konfigurationen setzen dürften. ARM zufolge steigt die Geschwindigkeit der Mali-G72 ausgehend von der Mali-G71 um 40 Prozent, dabei erhöhe sich die Rechenleistung pro Fläche um 20 Prozent und die Effizienz um 25 Prozent. Dieser Vergleich wurde wie üblich bei gleichem Fertigungsverfahren durchgeführt. Zu den Taktraten machte ARM keine Angaben, auch die Änderungen an der Mikroarchitektur beleuchteten die Briten kaum.

Als grobe Eckpunkte nennt ARM unter anderem die größeren und optimierten L1-Instruction-Caches, die geweiteten Tile-Buffer, die überarbeiteten Datenpfade für die Ausführungseinheiten und einen doppelt so hohen Durchsatz bei komplexen Berechnungen. Ausführlicher sprach der Hersteller über Deep Learning, Mobile Gaming, Virtual Reality und die in der Bifrost-Technik sowie der Mali-G72 vorhandenen Techniken.

Die PLS-Erweiterung (Pixel Local Storage) soll verglichen mit klassischen Multiple Render Targets (MRT) die Geschwindigkeit bei Deferred Shading stark erhöhen, da deutlich weniger Bandbreite benötigt werde. ARM demonstrierte dies am Beispiel von Afterpulse, einem Mobile-Titel, der Deferred Shading nutzt. Generell ist eine effektivere Nutzung des Speicherinterfaces wichtig, etwa durch AFBC (ARM Frame Buffer Compression).

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Sie hilft unter anderem, dass 4x MSAA kaum Leistung kostet und somit Kantenglättung in VR häufiger eingesetzt werden kann. Bei Mali-G72 ebenfalls vorhanden ist Multiview, was ab dem Oculus Mobile SDK 1.0.3 und von der Unity- sowie Unreal-Engine unterstützt wird. Multiview reduziert die CPU- und GPU-Zeit beim Stereoscopic Rendering. Hinzu kommt, dass die Mali-G72 Foveated Rendering beherrscht, sofern das VR-Headset mit Eye Tracking ausgestattet ist, und die App es kann.

Für Deep Learning spricht ARM von einer höheren Effizienz bei FP16-Berechnungen. Hinzu kommen weitere Optimierungen für Inferencing, das lokal auf dem Smartphone stattfinden kann, wenn es am Ladegerät angeschlossen ist. Anwendbare Szenarien sind etwa die Sortierung von Fotos und Videos in Kategorien wie Burgen oder Strand. Hersteller wie Qualcomm haben ähnliche Funktionen integriert, die sich bis heute aber noch nicht durchsetzen konnten.

Die Mali-G72 ist zusammen mit dem CCI-550-Interconnect und den neuen Cortex-Kernen A75 sowie A55 für Systems-on-a-Chip gedacht, die 2018 in Geräten stecken sollen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Blizzard
Preise im Itemshop von Diablo 4 entfachen Empörung

Die Community reagiert sauer auf Leaks über die Preise im Itemshop von Diablo 4. Ein Rüstungsset kostet fast so viel wie früher ein Add-on.

Blizzard: Preise im Itemshop von Diablo 4 entfachen Empörung
Artikel
  1. Noctua auf der Computex: Neue Lüfter, Offset-Mounting und Direct-Die
    Noctua auf der Computex
    Neue Lüfter, Offset-Mounting und Direct-Die

    Computex 2023Vor allem bei der Montage von AMD-Kühlern konnten die Kühlerspezialisten aus Österreich erneut einiges verbessern.

  2. Generative Fill: Wie Adobes KI-Funktionen das Internet spalten
    Generative Fill
    Wie Adobes KI-Funktionen das Internet spalten

    Die KI-Füllfunktion in Photoshop erfindet Hintergründe zu Gemälden oder Album-Covern. Einige finden das kreativ, andere sehen die Kunst bedroht.

  3. ROG Ally im Test: Asus nimmt es mit dem Steam Deck auf
    ROG Ally im Test
    Asus nimmt es mit dem Steam Deck auf

    Mit dem ROG Ally bietet Asus eine tolle Alternative zum Steam Deck an. Er ist merklich schneller, hat aber ein paar Schwächen.
    Ein Test von Oliver Nickel

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Gigabyte RTX 3060 Ti 369€ • Kingston Fury SSD 2TB (PS5-komp.) 129,91€ • Sony Deals Week • MindStar: Corsair Crystal RGB Midi Tower 119€, Palit RTX 4070 659€ • Roccat bis -50% • AVM Modems & Repeater bis -36% • Logitech G Pro Wireless Maus 89€ • The A500 Mini 74,99€ [Werbung]
    •  /