Kritik an Unicode und Ausblick

Der Unicode-Standard ist nicht perfekt und so gab und gibt es immer wieder Kritik an ihm. Einer der Kritikpunkte ist die Han-Vereinheitlichung. Bei ihr geht es darum, die Zeichen aus den unterschiedlichen ostasiatischen Sprachen auf ihre Grundformen zurückzuführen und entsprechend im Unicode-Standard abzubilden. Kritisiert wurde das, weil teilweise Zeichen vereinheitlicht wurden, die nicht unbedingt dieselbe Bedeutung hatten.

Stellenmarkt
  1. IT Security Analyst (m/w/d)
    Scheidt & Bachmann GmbH, Mönchengladbach
  2. HR Technology Solution Lead (m/f/x)
    Autodoc AG, Berlin
Detailsuche

Aus Sicht der IT-Sicherheit wird manchmal die Nutzung von Homoglyphen kritisiert, da dort bestimmte Zeichen durch andere, ähnlich aussehende Zeichen ausgetauscht werden, um beispielsweise eine Domain einer Bank zu imitieren und Kunden so um ihre Zugangsdaten zu bringen. Ein bekanntes Beispiel ist der Austausch des Buchstabens O durch eine 0, was schon beim ASCII-Standard funktionierte. Mit dem Unicode-Standard sind viele weitere Möglichkeiten für solche Homoglyphen dazugekommen.

Auch die Sortierung und Groß- und Kleinschreibung kann sich im Codespace von Unicode und entsprechender lokaler Regelungen manchmal als schwierig erweisen. Zum Beispiel ergibt sich die Sortierreihenfolge nicht unbedingt aus der Anordnung der Zeichen innerhalb des Codespace.

Unicode ist bisher nicht überall angekommen. So wird der Standard ISO/IEC 8859-15 respektive Latin-9 als 8-Bit-Code weiterhin verwendet. Genutzt wird diese Codierung unter anderem bei amtlichen Dokumenten wie der elektronischen Gesundheitskarte.

Golem Karrierewelt
  1. Kubernetes Dive-in-Workshop: virtueller Drei-Tage-Workshop
    19.-21.07.2022, Virtuell
  2. C++ Programmierung Grundlagen (keine Vorkenntnisse benötigt): virtueller Drei-Tage-Workshop
    01.-03.08.2022, virtuell
Weitere IT-Trainings

Im Internet sind mittlerweile über 97,6 Prozent aller Webseiten als UTF-8 kodiert, 1,1 Prozent als ISO-8859-1 und rund ein Prozent entfällt auf die Codierungen Windows-1251 und Windows-1252.

Alte Zeichensätze und Codierungen werden über kurz oder lang ein Nischendasein führen und zum Großteil durch Unicode ersetzt werden, zumindest was moderne Systeme angeht.

Im Rahmen der Script Encoding Initiative, welche die Linguistin Deborah Anderson seit 2002 an der University of California in Berkeley betreibt, werden neue Schriftsysteme für den Standard vorgeschlagen, sodass auch in Zukunft weitere Zeichen in den Standard aufgenommen werden.

So zog 2016 mit Adlam ein ungewöhnliches Schriftsystem in den Standard ein. Ungewöhnlich deshalb, weil dieses System erst seit 1989 existiert. Zwei Brüder entwickelten dieses System, um ihre Sprache, Fulani, phonetisch in einem Schriftsystem abbilden zu können. Etliche Jahre später wurde das System dank der Unterstützung der Script Encoding Initiative schließlich in den Unicode-Standard übernommen und wird mittlerweile unter Windows, Chrome OS und Android unterstützt.

Unicode ist die Zukunft

Dieses Beispiel zeigt, wie Unicode als Grundlage für die Nutzung und Überführung von Schriftsystemen in die digitale Welt fungiert. Noch einige Jahrzehnte zuvor war ein Großteil des Internets und der IT auf einige lateinische Buchstaben reduziert. Dank Unicode ist es möglich, in seiner jeweiligen Muttersprache und in seinem angestammten Schriftsystem digital zu kommunizieren, sich zu informieren und teilzuhaben.

Das Unicode Consortium wird seine Arbeit fortsetzen und sich dabei auch in einem teilweise politischen Spannungsfeld bewegen. Wie Randall Munroe, Autor des xkcd-Comics dazu einmal sagte:

"Ich bin unendlich erfreut über die hoffnungslose Aufgabe, die sich das Unicode-Konsortium selbst gestellt hat. [...] Am Anfang haben sie nur versucht, ein paar verschiedene Zeichensätze zu vereinheitlichen. Und bevor sie so richtig merkten, was passierte, hatten sie mit Entscheidungen zu kämpfen, die den Kern unseres Sprachgebrauchs betrafen, egal wie sehr sie versuchten, Richtlinien zu entwickeln, um diese Probleme zu vermeiden. Es ist einfach ein lustiges Beispiel dafür, wie seltsam Sprache ist, wie schwierig die menschliche Kommunikation ist und dass man diese Probleme nicht wirklich umgehen kann."

Die Golem-PCs bei Dubaro

So bietet uns Unicode lateinische Schrift, Spielkarten, Operatoren, Emojis, Schriftzeichen aus vielen menschlichen Kulturen und mehr. Und da sich Schrift und Sprache im Laufe der Zeit verändern, wird der Unicode-Standard wohl nie fertiggestellt, sondern ein lebendiger und sich weiterentwickelnder Standard sein.

Mit seinen 144.697 Zeichen und der Abbildung von über 150 Schriftsystemen liefert er einen Beitrag zum Erhalt der Schriftkultur und der Daten über die Jahrzehnte. In Zeiten von Globalisierung und weltweit miteinander interagierender Systeme ist ein gemeinsamer Zeichensatz sicherlich nicht die schlechteste Idee gewesen.

Florian Bottke ist seit vielen Jahren in der Softwareentwicklung, insbesondere im Backend, tätig. Daneben schreibt er regelmäßig zu technischen Themen und betreibt mit dem SNEScast einen Podcast rund um das Super Nintendo Entertainment System.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 So wird Unicode aktuell genutzt
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5


Hugie 30. Mär 2022 / Themenstart

Aach.. hier hat doch niemand Pointer auf Integer gecastet... sowas würden wir nie tun...

LASERwalker 28. Mär 2022 / Themenstart

Ich muss deinen Titel korrigieren: Nicht Unicode ist kompliziert, die menschliche Sprache...

strohkoenig 28. Mär 2022 / Themenstart

Wenn ich den Artikel richtig verstanden habe, dann sind die Planes Exx und Fxx für...

maxule 28. Mär 2022 / Themenstart

Das konnten Platten von Seagate* schon seit Jahrzehnten. "Sie geht, oder sie geht...

Kommentieren



Aktuell auf der Startseite von Golem.de
Cloud Cam
Amazon macht eigene Überwachungskamera unbrauchbar

Eine fünf Jahre alte Überwachungskamera wird noch dieses Jahr von Amazon außer Betrieb genommen. Kunden erhalten Ersatz, der vielen aber nichts nützt.

Cloud Cam: Amazon macht eigene Überwachungskamera unbrauchbar
Artikel
  1. Deutsche Telekom: Spezieller Smartphone-Tarif für Flüchtlinge aus der Ukraine
    Deutsche Telekom
    Spezieller Smartphone-Tarif für Flüchtlinge aus der Ukraine

    Wenn Flüchtlinge aus der Ukraine eine kostenlose SIM-Karte der Deutschen Telekom nutzen, können sie bald in den neuen Tarif wechseln.

  2. 30 Jahre Alone in the Dark: Als der Horror filmreif wurde
    30 Jahre Alone in the Dark
    Als der Horror filmreif wurde

    Alone in the Dark feiert Geburtstag. Das Horrorspiel war ein Meilenstein bei der filmreifen Inszenierung von Games. Wie spielt es sich heute?
    Von Andreas Altenheimer

  3. Update-Installation dauert: Störungen bei Kartenzahlungen im Einzelhandel bleiben
    Update-Installation dauert
    Störungen bei Kartenzahlungen im Einzelhandel bleiben

    Es gibt ein Update, um die Zahlungsstörungen mit Giro- oder Kreditkarte zu beseitigen. Die Verteilung des Updates braucht aber noch Zeit.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Alternate (ASUS VG30VQL1A QHD/200 Hz 329€ statt 399,90€ im Vergleich) • Apple iPhone 12 128 GB 669€ statt 699€ im Vergleich• Prime Video: Filme leihen für 0,99€ • Gigabyte RTX 3080 12 GB ab 1.024€ • Mindstar (u. a. MSI MPG X570 Gaming Plus 119€ statt 158,90€ im Vergleich) [Werbung]
    •  /