AV1: Dav1d deutlich schneller als Google-Decoder

Der AV1-Decoder des Videolan-Projektes macht vor allem auf Mobilsystemen große Fortschritte. Die Konkurrenz ist deutlich schlechter.

Artikel veröffentlicht am ,
Dav1d wird von der Videolan-Community erstellt.
Dav1d wird von der Videolan-Community erstellt. (Bild: Carl Court/Getty Images)

Das Entwicklerteam der Videolan-Community hat Version 0.7 des Decoder Dav1d für den freien Videocodec AV1 veröffentlicht. In der Ankündigung auf seinem Blog hebt Projektleiter Jean-Baptiste Kempf erneut die deutlichen Leistungsverbesserungen der Software hervor. Das gilt offenbar insbesondere im Vergleich zur verfügbaren Konkurrenz.

Stellenmarkt
  1. Anwendungsbetreuer (m/w/d) Systemadministration
    KÖNIGSTEINER AGENTUR GmbH, Stuttgart
  2. Technische Konzeption / Evaluation Content-Management-System (m/w/d)
    Universität Hamburg, Hamburg
Detailsuche

Den wohl größten Zuwachs erreicht Dav1d durch eine komplett neue Implementierung für die Referenzierung sogenannter Motion Vector. Dabei handelt es sich um ein besonders wichtiges Werkzeug des AV1-Codec. Ausgehend von Referenz-Frames bilden die Motion Vector zeitliche und räumliche Bewegungen in anderen Frames ab. Der neue Code beschleunige das Decoding um rund 10 Prozent und reduziere zusätzlich dazu die Speicherbelastung um 25 Prozent.

Für die x86-Architektur hat das Team seinen Assembly-Code für 8-Bit-Farbtiefe fertiggestellt. Ebenfalls erledigt hat das Team zuvor noch ausstehende Optimierungen für SSSE3 und AVX2. Für die aktuelle Version sind weitere Optimierungen auf Grundlage von AVX-512 zu Dav1d hinzugekommen, was bisher jedoch nur von einigen wenigen modernen CPUs unterstützt wird. Kempf weist außerdem darauf hin, dass es künftig schwerer werde, Dav1d auf x86-CPUs künftig noch weiter zu beschleunigen. Immerhin sei der Decoder aber immer noch drei- bis fünfmal schneller als die Referenz der Alliance for Open Media.

Schnell auf ARM

Einen großen Fokus hat das Entwicklerteam zusätzlich auf ARM-CPUs und den Einsatz in Mobilsystemen gelegt. So sei die Assembly-Implementierung für ARM64 mit der aktuellen Version 0.7 größtenteils fertiggestellt. Die AV1-Decodierung sei damit nun auch auf entsprechenden Smartphones leistbar.

Golem Akademie
  1. Docker & Containers - From Zero to Hero
    27.-29. Oktober 2021, online
  2. Advanced Python - Fortgeschrittene Programmierthemen
    27.-28. Januar 2022, online
  3. OpenShift Installation & Administration
    31. Januar-2. Februar 2022, online
Weitere IT-Trainings

In einer eigenen Auswertung vergleicht das Team Dav1d mit dem Google-Decoder Gav1, wobei letzterer deutlich schlechter abschneidet, vor allem bei der Nutzung mehrerer Threads. Als Referenz dient hier unter anderem ein Pixel 1 mit Snapdragon 821 aus dem Jahr 2016.

Zur Echtzeit-Decodierung eines 1080p-Samples von Netflix reichen Dav1d zwei Threads auf den Little-Kernen der CPU. Der Google-Decoder leistet dies nicht. Darüber hinaus ist Dav1d der Auswertung zufolge mindestens doppelt so schnell wie Gav1.

Kempf zeigt sich sehr erfreut darüber und schreibt: "Dav1d ist nun ein sehr schneller Decoder auf Desktop-Rechnern und Laptops, aber vor allem auch auf Mobilsystemen, wo er sehr beeindruckende Leistung zeigt".

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Kia EV 6 im Test
Die Sport-Limousine

Der Kia EV 6 basiert auf einer reinen E-Auto-Plattform und nutzt ein 800-Volt-Batteriesystem. Technik und Design hinterlassen beim Test einen guten Eindruck.
Ein Test von Dirk Kunde

Kia EV 6 im Test: Die Sport-Limousine
Artikel
  1. Android: Google senkt weitere Play-Store-Gebühren
    Android
    Google senkt weitere Play-Store-Gebühren

    Entwickler von Android-Apps mit Abonnements müssen künftig bereits im ersten Jahr nur noch die Hälfte der bisherigen Gebühren zahlen.

  2. Kernnetz: Telekom wechselt Cisco-Router im zentralen Backbone aus
    Kernnetz
    Telekom wechselt Cisco-Router im zentralen Backbone aus

    Die Deutsche Telekom hat einen besseren Cisco-Router in ihrem zentralen Backbone installiert. Der erreicht 260 TBit/s und wirft Fragen zur IT-Sicherheit auf.

  3. Geekbench & GFXBench: Erste Benchmarks zeigen starken Apple M1 Max
    Geekbench & GFXBench
    Erste Benchmarks zeigen starken Apple M1 Max

    Das Apple Silicon schneidet gut ab: Der M1 Max legt sich tatsächlich mit einer Geforce RTX 3080 Mobile und den schnellsten Laptop-CPUs an.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Seagate SSDs & HDD günstiger (u. a. ext. HDD 14TB 326,99) • Dualsense PS5-Controller Weiß 57,99€ • World of Tanks jetzt mit Einsteigerparket ausprobieren • Docking-Station für Nintendo Switch 9,99€ • Alternate (u. a. iPhone 12 Pro 512GB 1.269€) • HP Herbst Sale bei NBB [Werbung]
    •  /