XML-Know How

Strukturen statt Formatierungen

Es gibt mithin mehrere Gründe, nicht die Formatierung eines Dokumentes, sondern die Struktur und die Art des Inhalts eindeutig zu beschreiben. Der wichtigste ist sicherlich, dass die Struktur einem Dokument aus seinem Inhalt heraus innewohnt, während die Formatierung nichts Absolutes ist. Anders gesagt: Ein Dokument bestimmten Inhalts kann auf die unterschiedlichste Weise formatiert werden, ohne dadurch seine Struktur zu verlieren. Wenn also der Text und seine formale wie inhaltliche Struktur eindeutig kodiert sind, wird sich jede systematische Formatierung seiner Elemente automatisiert herstellen lassen.

Dieser vielleicht neu erscheinende Grundgedanke ist dabei so alt wie das Büchermachen selbst: Schon immer war es die Aufgabe des Schriftsetzers, die Struktur des Textes sichtbar zu machen. Er bedient sich dabei der Möglichkeiten der Typographie. Das heißt: Typographie dient dazu, dem Leser die Struktur eines Textes – nicht den Text selbst! – sichtbar zu machen: Überschriften werden hervorgehoben, um sie kenntlich zu machen, kursive oder eingerückte Passagen haben eine eigene Bedeutung im Text (sie kennzeichnen z. B. Eigennamen oder Zitate) und werden nicht etwa willkürlich gesetzt.

Insofern ist es seit jeher Voraussetzung für gute Typographie, dass sich Hersteller und Schriftsetzer mit der Struktur eines Textes genauestens auseinandersetzen, um sie typographisch umsetzen zu können. Dies war bislang nur durch eine intensive Beschäftigung mit den Inhalten möglich – und dennoch immer subjektiv geprägt.

Die Methode, die Struktur eines Textes in einer objektivierten und für den Rechner lesbaren Form im Dokument abzuspeichern, löst eine ganze Reihe Probleme: Zunächst wird der Text automatisiert weiterverarbeitbar, und zwar in beliebiger Typographie und für die unterschiedlichsten Ausgabeformen. Damit wird dem Anspruch auf Medienneutralität Rechnung getragen.

Indem die Struktur explizit in den Daten kodiert ist, entfällt die Notwendigkeit, sie immer wieder an den unterschiedlichsten Stellen (Lektorat, Redaktion, Herstellung, technischer Betrieb) erschließen zu müssen. Die Daten sind nun durch intelligente Suchanfragen recherchierbar und damit deutlich wertvoller. Und vor allem: der Weg zu kostengünstiger Mehrfachnutzung ist frei.

Schließlich lassen sich in einem Text sehr viel mehr Informationen abspeichern als zur rein typographischen Umsetzung benötigt werden, z. B. Verwaltungsinformationen, die überhaupt nicht gedruckt werden sollen, aber für den Verlag von großem Nutzen sein können. Dies könnten z. B. bei einem Lexikon die Daten des Autors eines Artikels sein, um die Autorenabrechnung (berechnet nach Anschlägen oder Druckzeilen) vollautomatisch berechnen zu können. Ebenso lässt sich auch der erreichte redaktionelle Bearbeitungsstand eines Artikels abbilden. Damit wird es ein Leichtes, auch bei Tausenden von Artikeln jederzeit einen genauen Überblick darüber zu behalten, wie viele bereits imprimiert sind, welche noch beim Autor sind, welche angemahnt werden müssen, wo die Bildrechte noch ungeklärt sind etc.