XML-Know How

Fazit

 

Eine Zeichenkodierung, die von aller Hard- und Software gelesen werden kann,
ist notwendige Voraussetzung für medienneutrale Datenhaltung. Zwei Lösungen sind derzeit verfügbar:

     

  • ISO 8879):

       

    • Beschränkung auf die 128 Zeichen, die in allen Betriebssystemen und
      Programmen gleich kodiert sind (ASCII.
    • Alle anderen Zeichen werden durch besonders gekennzeichnete Zeichen-
      Kombinationen kodiert (sog. entities; z. B. »ä« als ä für »a-umlaut«).
    • Da ISO-Entities Teil des SGML-Standards sind, können sie nur von
      entsprechender Software (
      SGML/XML/HTML-Programme) verarbeitet werden. Office-Software beherrscht diesen Standard meist nicht.
    • ISO-Entities werden wegen ihrer Zuverlässigkeit und
      unbegrenzten Abwärtskompatibilität gerade im professionellen Umfeld
      noch immer häufig verwendet.
    •  

  • Unicode (ISO 10646):

       

    • Ein neuer Standard, mit dem derzeit ca. 65 500 Zeichen-
      adressen eindeutig kodiert werden können.
    • Die softwareseitige Umsetzung dieses Standards leidet
      noch an Kinderkrankheiten.
    • Universalität und zunehmende Verbreitung lassen die Prognose zu,
      dass Unicode die Zukunft gehört.
    • Derzeit ist Unicode in der Version 2.0 (= ISO 10646-1)
      im Encoding UTF-8 zuverlässig verwendbar.
    •  

  •