Fazit
Eine Zeichenkodierung, die von aller Hard- und Software gelesen werden kann,
ist notwendige Voraussetzung für medienneutrale Datenhaltung. Zwei Lösungen sind derzeit verfügbar:
- ISO 8879):
- Beschränkung auf die 128 Zeichen, die in allen Betriebssystemen und
Programmen gleich kodiert sind (ASCII. - Alle anderen Zeichen werden durch besonders gekennzeichnete Zeichen-
Kombinationen kodiert (sog. entities; z. B. »ä« als ä für »a-umlaut«). - Da ISO-Entities Teil des SGML-Standards sind, können sie nur von
entsprechender Software (SGML/XML/HTML-Programme) verarbeitet werden. Office-Software beherrscht diesen Standard meist nicht. - ISO-Entities werden wegen ihrer Zuverlässigkeit und
unbegrenzten Abwärtskompatibilität gerade im professionellen Umfeld
noch immer häufig verwendet.
- Beschränkung auf die 128 Zeichen, die in allen Betriebssystemen und
- Unicode (ISO 10646):
- Ein neuer Standard, mit dem derzeit ca. 65 500 Zeichen-
adressen eindeutig kodiert werden können. - Die softwareseitige Umsetzung dieses Standards leidet
noch an Kinderkrankheiten. - Universalität und zunehmende Verbreitung lassen die Prognose zu,
dass Unicode die Zukunft gehört. - Derzeit ist Unicode in der Version 2.0 (= ISO 10646-1)
im Encoding UTF-8 zuverlässig verwendbar.
- Ein neuer Standard, mit dem derzeit ca. 65 500 Zeichen-