Zum Hauptinhalt Zur Navigation

Golem Plus Artikel
Huffman-Codierung:
So funktioniert der Baum, der Daten schrumpft

Algorithmus des Monats
Ohne Algorithmen zur Datenkompression wäre ein Großteil des Internets undenkbar. Wir stellen einen besonders einfachen vor.
/ Johannes Hiltscher
2 Kommentare News folgen (öffnet im neuen Fenster)
So sollte ein Huffman-Baum aussehen: möglichst gut ausgeglichen, ohne weit herausstehende Äste. (Bild: Bessi, Pixabay)
So sollte ein Huffman-Baum aussehen: möglichst gut ausgeglichen, ohne weit herausstehende Äste. Bild: Bessi, Pixabay

Egal ob Musik, Video oder Text: Oftmals sind diese Daten schlecht organisiert, sie zu speichern oder zu übertragen benötigt daher unnötig viele Bits. Dieses Problem löst die Datenkompression: Sie organisiert die Daten neu, so dass sie mit deutlich weniger Bits dargestellt werden können. Wie das funktioniert, lässt sich anhand der Huffman-Codierung, die einen sogenannten Huffman-Baum erzeugt, besonders leicht verstehen.

Nehmen wir diesen Text als Beispiel. Damit ich ihn am Computer schreiben kann, muss er als Folge von Nullen und Einsen dargestellt werden. Ein Code, eine feste Menge vorgegebener 0-1-Folgen (Codewörter), beschreibt die Abbildung von einem Buchstaben auf ein Codewort und umgekehrt. Nehmen wir etwa eine der ISO-8859-Codetabellen(öffnet im neuen Fenster) (eine Erweiterung des American Standard Code for Information Interchange, kurz ASCII), wird jeder Buchstabe dieses Texts als 8-Bit-Wert dargestellt.

Golem Plus Artikel