XML-Know How

XML – ein freies Format

Doch wer legt fest, welche Tags in den Daten verwendet werden dürfen? Im XML-Standard findet sich dazu nichts, und das hat System: Es ist dem Nutzer von XML völlig freigestellt, wie er Elemente benennt und verschachtelt, welche Attribute er verwendet und wie er diese Daten auswertet. Es liegt also beim Verlag, sich sprechende und für seine Anforderungen sinnvolle Struktureinheiten zu wählen. Diese werden in einer eigenen Grammatik (DTD oder XML-Schema, vgl. Kap. 4.8) abgelegt.

XML selbst definiert also lediglich, in welcher Form die Auszeichnungen gesetzt werden müssen. Genau betrachtet ist XML wie SGML keine Sprache, sondern definiert eine Syntax, mit der man beliebige Grammatiken entwerfen kann. Für die Grammatik ist dann der Anwender selbst zuständig – er kann sich auf diese Weise ein Regelwerk schaffen, das seine Inhalte sehr präzise abbildet – oder sich an einen der offenen Standards halten.

Das ist im Wesentlichen schon die Kernaussage von XML: Texte und andere Inhalte werden mit frei gewählten Tags und Attributen präzise beschrieben.

Welche grundlegenden Vorteile stecken nun hinter diesem so einfachen Prinzip? Gerade die Einfachheit hat ihre besonderen Vorteile. Ein kompaktes Set von einfachen Regeln vereinheitlicht die Beschreibung von Inhalten durch Tags extrem, ohne sie dabei einzuengen. Da XML vom World Wide Web Consortium (W3C) definiert wurde, sind in den Standard die Vorstellungen international maßgeblicher Forschungseinrichtungen und Industriekonzerne eingeflossen. XML ist deshalb schnell als ein universeller Standard akzeptiert worden.

Die grundlegenden XML-Regeln sind so gestaltet, dass XML-Daten für die computergestützte Verarbeitung besonders gut geeignet sind. Dabei ist XML ein Standard, der auf den kleinsten gemeinsamen Nenner aller Computersysteme aufsetzt: auf Textdaten ohne jede Formatierung. Eine XML-Datei kann daher von allen gängigen Computersystemen der Welt gelesen und verarbeitet werden. Das ist mit herstellergebundenen Formaten wie z. B. Microsoft Word oder Quark Xpress nicht möglich. Wenn bei diesen das richtige Betriebssystem und die richtige Software-Version fehlen, können die Dateien nicht verarbeitet werden. XML ist dagegen plattformneutral und herstellerunabhängig. Das ist für einen Verlag von großem Vorteil, da damit gewährleistet ist, dass die Inhalte (das eigentliche Kapital der Verlage) langfristig elektronisch verfügbar sind.