Mali-G72: ARMs Grafikeinheit für Deep-Learning-Smartphones

Die Mali-G72 ist eine GPU für SoCs. Die Bifrost-Architektur von ARM enthält Verbesserungen für VR-Headsets und eine effizientere FP16-Berechnung für Inferencing auf dem Smartphone. Trotz wie gehabt 32 Kernen soll die Leistung um 40 Prozent steigen.

Artikel veröffentlicht am ,
Mali-G72
Mali-G72 (Bild: ARM)

ARM hat die Mali-G72 präsentiert, eine neue GPU für Systems-on-a-Chip (SoC). Die auf dem Tech Day des britischen Entwicklers näher erläuterte Grafikeinheit nutzt wie die vorherige Mali-G71 die neue Bifrost-Architektur, weist aber allerhand überarbeitete Einheiten auf und unterstützt neue Funktionen. Gedacht ist sie für SoCs, die in künftigen Top-Smartphones und VR-Headsets wie den kommenden Google-Daydream-Modellen stecken werden.

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)
Stellenmarkt
  1. Junior Projektmanager / Berater SAP Logistik (m/w/d)
    BWI GmbH, deutschlandweit
  2. Wissenschaftliche Mitarbeiterin / Wissenschaftlicher Mitarbeiter (w/m/d) oder Akademische Rätin ... (m/w/d)
    Universität Passau, Passau
Detailsuche

Laut Hersteller weist die Mali-G72-GPU weiterhin bis zu 32 Kerne auf, wobei die meisten Partner auf MP8- oder MP16-Konfigurationen setzen dürften. ARM zufolge steigt die Geschwindigkeit der Mali-G72 ausgehend von der Mali-G71 um 40 Prozent, dabei erhöhe sich die Rechenleistung pro Fläche um 20 Prozent und die Effizienz um 25 Prozent. Dieser Vergleich wurde wie üblich bei gleichem Fertigungsverfahren durchgeführt. Zu den Taktraten machte ARM keine Angaben, auch die Änderungen an der Mikroarchitektur beleuchteten die Briten kaum.

Als grobe Eckpunkte nennt ARM unter anderem die größeren und optimierten L1-Instruction-Caches, die geweiteten Tile-Buffer, die überarbeiteten Datenpfade für die Ausführungseinheiten und einen doppelt so hohen Durchsatz bei komplexen Berechnungen. Ausführlicher sprach der Hersteller über Deep Learning, Mobile Gaming, Virtual Reality und die in der Bifrost-Technik sowie der Mali-G72 vorhandenen Techniken.

Die PLS-Erweiterung (Pixel Local Storage) soll verglichen mit klassischen Multiple Render Targets (MRT) die Geschwindigkeit bei Deferred Shading stark erhöhen, da deutlich weniger Bandbreite benötigt werde. ARM demonstrierte dies am Beispiel von Afterpulse, einem Mobile-Titel, der Deferred Shading nutzt. Generell ist eine effektivere Nutzung des Speicherinterfaces wichtig, etwa durch AFBC (ARM Frame Buffer Compression).

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)
Golem Karrierewelt
  1. C++ Programmierung Grundlagen (keine Vorkenntnisse benötigt): virtueller Drei-Tage-Workshop
    01.-03.08.2022, virtuell
  2. LPI DevOps Tools Engineer – Prüfungsvorbereitung: virtueller Zwei-Tage-Workshop
    21./22.07.2022, Virtuell
Weitere IT-Trainings

Sie hilft unter anderem, dass 4x MSAA kaum Leistung kostet und somit Kantenglättung in VR häufiger eingesetzt werden kann. Bei Mali-G72 ebenfalls vorhanden ist Multiview, was ab dem Oculus Mobile SDK 1.0.3 und von der Unity- sowie Unreal-Engine unterstützt wird. Multiview reduziert die CPU- und GPU-Zeit beim Stereoscopic Rendering. Hinzu kommt, dass die Mali-G72 Foveated Rendering beherrscht, sofern das VR-Headset mit Eye Tracking ausgestattet ist, und die App es kann.

Für Deep Learning spricht ARM von einer höheren Effizienz bei FP16-Berechnungen. Hinzu kommen weitere Optimierungen für Inferencing, das lokal auf dem Smartphone stattfinden kann, wenn es am Ladegerät angeschlossen ist. Anwendbare Szenarien sind etwa die Sortierung von Fotos und Videos in Kategorien wie Burgen oder Strand. Hersteller wie Qualcomm haben ähnliche Funktionen integriert, die sich bis heute aber noch nicht durchsetzen konnten.

Die Mali-G72 ist zusammen mit dem CCI-550-Interconnect und den neuen Cortex-Kernen A75 sowie A55 für Systems-on-a-Chip gedacht, die 2018 in Geräten stecken sollen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Ukrainekrieg
Erster Einsatz einer US-Kamikazedrohne dokumentiert

Eine Switchblade-Drohne hat offenbar einen russischen Panzer getroffen. Dessen Besatzung soll sich auf dem Turm mit Alkohol vergnügt haben.

Ukrainekrieg: Erster Einsatz einer US-Kamikazedrohne dokumentiert
Artikel
  1. Pornoplattform: Medienaufseher kämpfen weiter gegen xHamster
    Pornoplattform
    Medienaufseher kämpfen weiter gegen xHamster

    Die Medienaufseher in Deutschland wollen das Pornoportal xHamster dazu verpflichten, ihren Angeboten eine wirksame Altersverifikation vorzuschalten.

  2. Heimnetze: Die Masche mit dem Nachbarn
    Heimnetze
    Die Masche mit dem Nachbarn

    Heimnetze sind Inseln mit einer schmalen und einsamen Anbindung zum Internet. Warum eine Öffnung dieser strengen Isolation sinnvoll ist.
    Von Jochen Demmer

  3. Störungen an Zahlungsterminal: Kartenzahlungen in vielen Geschäften weiterhin nicht möglich
    Störungen an Zahlungsterminal
    Kartenzahlungen in vielen Geschäften weiterhin nicht möglich

    Die bundesweite Störung am Kartenzahlungsterminal eines Typs dauert an. Bei Aldi, Rossmann und Co. kann weder mit Girokarte noch mit Kreditkarte bezahlt werden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte RTX 3080 12GB günstig wie nie: 1.024€ • MSI Gaming-Monitor 32" 4K UHD günstig wie nie: 999€ • Nur noch heute: Cyber Week mit tollen Rabatten • Mindstar (u. a. AMD Ryzen 5 5600 179€, Palit RTX 3070 GamingPro 669€) • Days of Play (u. a. PS5-Controller 49,99€) [Werbung]
    •  /