Abo
  • Services:

Mali-G72: ARMs Grafikeinheit für Deep-Learning-Smartphones

Die Mali-G72 ist eine GPU für SoCs. Die Bifrost-Architektur von ARM enthält Verbesserungen für VR-Headsets und eine effizientere FP16-Berechnung für Inferencing auf dem Smartphone. Trotz wie gehabt 32 Kernen soll die Leistung um 40 Prozent steigen.

Artikel veröffentlicht am ,
Mali-G72
Mali-G72 (Bild: ARM)

ARM hat die Mali-G72 präsentiert, eine neue GPU für Systems-on-a-Chip (SoC). Die auf dem Tech Day des britischen Entwicklers näher erläuterte Grafikeinheit nutzt wie die vorherige Mali-G71 die neue Bifrost-Architektur, weist aber allerhand überarbeitete Einheiten auf und unterstützt neue Funktionen. Gedacht ist sie für SoCs, die in künftigen Top-Smartphones und VR-Headsets wie den kommenden Google-Daydream-Modellen stecken werden.

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)
Stellenmarkt
  1. Universitätsstadt Marburg, Marburg
  2. Controlware GmbH, Meerbusch bei Düsseldorf

Laut Hersteller weist die Mali-G72-GPU weiterhin bis zu 32 Kerne auf, wobei die meisten Partner auf MP8- oder MP16-Konfigurationen setzen dürften. ARM zufolge steigt die Geschwindigkeit der Mali-G72 ausgehend von der Mali-G71 um 40 Prozent, dabei erhöhe sich die Rechenleistung pro Fläche um 20 Prozent und die Effizienz um 25 Prozent. Dieser Vergleich wurde wie üblich bei gleichem Fertigungsverfahren durchgeführt. Zu den Taktraten machte ARM keine Angaben, auch die Änderungen an der Mikroarchitektur beleuchteten die Briten kaum.

Als grobe Eckpunkte nennt ARM unter anderem die größeren und optimierten L1-Instruction-Caches, die geweiteten Tile-Buffer, die überarbeiteten Datenpfade für die Ausführungseinheiten und einen doppelt so hohen Durchsatz bei komplexen Berechnungen. Ausführlicher sprach der Hersteller über Deep Learning, Mobile Gaming, Virtual Reality und die in der Bifrost-Technik sowie der Mali-G72 vorhandenen Techniken.

Die PLS-Erweiterung (Pixel Local Storage) soll verglichen mit klassischen Multiple Render Targets (MRT) die Geschwindigkeit bei Deferred Shading stark erhöhen, da deutlich weniger Bandbreite benötigt werde. ARM demonstrierte dies am Beispiel von Afterpulse, einem Mobile-Titel, der Deferred Shading nutzt. Generell ist eine effektivere Nutzung des Speicherinterfaces wichtig, etwa durch AFBC (ARM Frame Buffer Compression).

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Sie hilft unter anderem, dass 4x MSAA kaum Leistung kostet und somit Kantenglättung in VR häufiger eingesetzt werden kann. Bei Mali-G72 ebenfalls vorhanden ist Multiview, was ab dem Oculus Mobile SDK 1.0.3 und von der Unity- sowie Unreal-Engine unterstützt wird. Multiview reduziert die CPU- und GPU-Zeit beim Stereoscopic Rendering. Hinzu kommt, dass die Mali-G72 Foveated Rendering beherrscht, sofern das VR-Headset mit Eye Tracking ausgestattet ist, und die App es kann.

Für Deep Learning spricht ARM von einer höheren Effizienz bei FP16-Berechnungen. Hinzu kommen weitere Optimierungen für Inferencing, das lokal auf dem Smartphone stattfinden kann, wenn es am Ladegerät angeschlossen ist. Anwendbare Szenarien sind etwa die Sortierung von Fotos und Videos in Kategorien wie Burgen oder Strand. Hersteller wie Qualcomm haben ähnliche Funktionen integriert, die sich bis heute aber noch nicht durchsetzen konnten.

Die Mali-G72 ist zusammen mit dem CCI-550-Interconnect und den neuen Cortex-Kernen A75 sowie A55 für Systems-on-a-Chip gedacht, die 2018 in Geräten stecken sollen.



Anzeige
Blu-ray-Angebote
  1. 34,99€

Folgen Sie uns
       


Sky Ticket TV-Stick im Test

Wir haben den Sky Ticket TV Stick getestet. Der Streamingstick mit Fernbedienung bringt Sky Ticket auf den Fernseher, wenn dieser den Streamingdienst des Pay-TV-Anbieters nicht unterstützt. Auf dem Stick läuft das aktuelle Sky Ticket, das im Vergleich zur Vorgängerversion erheblich verbessert wurde. Den Sky Ticket TV gibt es quasi kostenlos, weil dieser nur zusammen mit passenden Sky-Ticket-Abos im Wert von 30 Euro angeboten wird.

Sky Ticket TV-Stick im Test Video aufrufen
Grafikkarten: Das kann Nvidias Turing-Architektur
Grafikkarten
Das kann Nvidias Turing-Architektur

Zwei Jahre nach Pascal folgt Turing: Die GPU-Architektur führt Tensor-Cores und RT-Kerne für Spieler ein. Die Geforce RTX haben mächtige Shader-Einheiten, große Caches sowie GDDR6-Videospeicher für Raytracing, für Deep-Learning-Kantenglättung und für mehr Leistung.
Ein Bericht von Marc Sauter

  1. Tesla T4 Nvidia bringt Googles Cloud auf Turing
  2. Battlefield 5 mit Raytracing Wenn sich der Gegner in unserem Rücken spiegelt
  3. Nvidia Turing Geforce RTX 2080 rechnet 50 Prozent schneller

Lenovo Thinkpad T480s im Test: Das trotzdem beste Business-Notebook
Lenovo Thinkpad T480s im Test
Das trotzdem beste Business-Notebook

Mit dem Thinkpad T480s verkauft Lenovo ein exzellentes 14-Zoll-Business-Notebook. Anschlüsse und Eingabegeräte überzeugen uns - leider ist aber die CPU konservativ eingestellt und ein gutes Display kostet extra.
Ein Test von Marc Sauter und Sebastian Grüner

  1. Thinkpad E480/E485 im Test AMD gegen Intel in Lenovos 14-Zoll-Notebook
  2. Lenovo Das Thinkpad P1 ist das X1 Carbon als Workstation
  3. Thinkpad Ultra Docking Station im Test Das USB-Typ-C-Dock mit robuster Mechanik

Leistungsschutzrecht: So viel Geld würden die Verlage von Google bekommen
Leistungsschutzrecht
So viel Geld würden die Verlage von Google bekommen

Das europäische Leistungsschutzrecht soll die Zukunft der Presse sichern. Doch in Deutschland würde derzeit ein einziger Verlag fast zwei Drittel der Einnahmen erhalten.
Eine Analyse von Friedhelm Greis

  1. Netzpolitik Willkommen im europäischen Filternet
  2. Urheberrecht Europaparlament für Leistungsschutzrecht und Uploadfilter
  3. Leistungsschutzrecht/Uploadfilter Wikipedia protestiert gegen Urheberrechtsreform

    •  /