Abo
  • Services:

Mali-G72: ARMs Grafikeinheit für Deep-Learning-Smartphones

Die Mali-G72 ist eine GPU für SoCs. Die Bifrost-Architektur von ARM enthält Verbesserungen für VR-Headsets und eine effizientere FP16-Berechnung für Inferencing auf dem Smartphone. Trotz wie gehabt 32 Kernen soll die Leistung um 40 Prozent steigen.

Artikel veröffentlicht am ,
Mali-G72
Mali-G72 (Bild: ARM)

ARM hat die Mali-G72 präsentiert, eine neue GPU für Systems-on-a-Chip (SoC). Die auf dem Tech Day des britischen Entwicklers näher erläuterte Grafikeinheit nutzt wie die vorherige Mali-G71 die neue Bifrost-Architektur, weist aber allerhand überarbeitete Einheiten auf und unterstützt neue Funktionen. Gedacht ist sie für SoCs, die in künftigen Top-Smartphones und VR-Headsets wie den kommenden Google-Daydream-Modellen stecken werden.

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)
Stellenmarkt
  1. BWI GmbH, München, Nürnberg, Rheinbach
  2. Bosch Gruppe, Abstatt

Laut Hersteller weist die Mali-G72-GPU weiterhin bis zu 32 Kerne auf, wobei die meisten Partner auf MP8- oder MP16-Konfigurationen setzen dürften. ARM zufolge steigt die Geschwindigkeit der Mali-G72 ausgehend von der Mali-G71 um 40 Prozent, dabei erhöhe sich die Rechenleistung pro Fläche um 20 Prozent und die Effizienz um 25 Prozent. Dieser Vergleich wurde wie üblich bei gleichem Fertigungsverfahren durchgeführt. Zu den Taktraten machte ARM keine Angaben, auch die Änderungen an der Mikroarchitektur beleuchteten die Briten kaum.

Als grobe Eckpunkte nennt ARM unter anderem die größeren und optimierten L1-Instruction-Caches, die geweiteten Tile-Buffer, die überarbeiteten Datenpfade für die Ausführungseinheiten und einen doppelt so hohen Durchsatz bei komplexen Berechnungen. Ausführlicher sprach der Hersteller über Deep Learning, Mobile Gaming, Virtual Reality und die in der Bifrost-Technik sowie der Mali-G72 vorhandenen Techniken.

Die PLS-Erweiterung (Pixel Local Storage) soll verglichen mit klassischen Multiple Render Targets (MRT) die Geschwindigkeit bei Deferred Shading stark erhöhen, da deutlich weniger Bandbreite benötigt werde. ARM demonstrierte dies am Beispiel von Afterpulse, einem Mobile-Titel, der Deferred Shading nutzt. Generell ist eine effektivere Nutzung des Speicherinterfaces wichtig, etwa durch AFBC (ARM Frame Buffer Compression).

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Sie hilft unter anderem, dass 4x MSAA kaum Leistung kostet und somit Kantenglättung in VR häufiger eingesetzt werden kann. Bei Mali-G72 ebenfalls vorhanden ist Multiview, was ab dem Oculus Mobile SDK 1.0.3 und von der Unity- sowie Unreal-Engine unterstützt wird. Multiview reduziert die CPU- und GPU-Zeit beim Stereoscopic Rendering. Hinzu kommt, dass die Mali-G72 Foveated Rendering beherrscht, sofern das VR-Headset mit Eye Tracking ausgestattet ist, und die App es kann.

Für Deep Learning spricht ARM von einer höheren Effizienz bei FP16-Berechnungen. Hinzu kommen weitere Optimierungen für Inferencing, das lokal auf dem Smartphone stattfinden kann, wenn es am Ladegerät angeschlossen ist. Anwendbare Szenarien sind etwa die Sortierung von Fotos und Videos in Kategorien wie Burgen oder Strand. Hersteller wie Qualcomm haben ähnliche Funktionen integriert, die sich bis heute aber noch nicht durchsetzen konnten.

Die Mali-G72 ist zusammen mit dem CCI-550-Interconnect und den neuen Cortex-Kernen A75 sowie A55 für Systems-on-a-Chip gedacht, die 2018 in Geräten stecken sollen.



Anzeige
Spiele-Angebote
  1. 4,99€
  2. 31,99€
  3. (-78%) 6,66€
  4. 2,50€

Folgen Sie uns
       


Besuch im Testturm Rottweil von Thyssen-Krupp - Bericht

Thyssen-Krupp testet in Baden-Württemberg in einen Turm einen revolutionären Aufzug, der ohne Seile auskommt.

Besuch im Testturm Rottweil von Thyssen-Krupp - Bericht Video aufrufen
Uploadfilter: Der Generalangriff auf das Web 2.0
Uploadfilter
Der Generalangriff auf das Web 2.0

Die EU-Urheberrechtsreform könnte Plattformen mit nutzergenerierten Inhalten stark behindern. Die Verfechter von Uploadfiltern zeigen dabei ein Verständnis des Netzes, das mit der Realität wenig zu tun hat. Statt Lizenzen könnte es einen anderen Ausweg geben.
Eine Analyse von Friedhelm Greis

  1. Uploadfilter EU-Kommission bezeichnet Reformkritiker als "Mob"
  2. EU-Urheberrecht Die verdorbene Reform
  3. Leistungsschutzrecht und Uploadfilter EU-Unterhändler einigen sich auf Urheberrechtsreform

Tom Clancy's The Division 2 im Test: Richtig guter Loot-Shooter
Tom Clancy's The Division 2 im Test
Richtig guter Loot-Shooter

Ubisofts neuer Online-Shooter beweist, dass komplexe Live-Spiele durchaus von Anfang an überzeugen können. Bis auf die schwache Geschichte und Gegner, denen selbst Dauerbeschuss kaum etwas anhaben kann, ist The Division 2 ein spektakuläres Spiel.
Von Jan Bojaryn

  1. Netztest Connect Netztest urteilt trotz Funklöchern zweimal sehr gut
  2. Netztest Chip verteilt viel Lob trotz Funklöchern

Sailfish X im Test: Die Android-Alternative mit ein bisschen Android
Sailfish X im Test
Die Android-Alternative mit ein bisschen Android

Seit kurzem ist Sailfish OS mit Android-Unterstützung für weitere Xperia-Smartphones von Sony verfügbar. Fünf Jahre nach unserem letzten Test wird es Zeit, dass wir uns das alternative Mobile-Betriebssystem wieder einmal anschauen und testen, wie es auf einem ursprünglichen Android-Gerät läuft.
Ein Test von Tobias Költzsch

  1. Android, Debian, Sailfish OS Gemini PDA bekommt Dreifach-Boot-Option

    •  /