XML-Know How

Viele Dateiformate verderben den Content

Neben das Problem der Lesbarkeit von Dateien auf Zeichen-Ebene tritt ein weiteres: Die Lesbarkeit und gemeinsame Verarbeitbarkeit von Dateien verschiedenen Ursprungs. Solange nur das einzelne Buch betrachtet wird – und dieses nur von einem Autor geschrieben wird, entstehen hier in der Regel keine nennenswerten Probleme. Sobald aber ein Werk – z. B. ein Lexikon mit vielen einzelnen Artikeln – von mehreren Autoren, Copy-Editoren, Lektoren etc. geschrieben und bearbeitet wird, wird es wichtig, die Daten über alle Bearbeiter hinweg einheitlich aufzubereiten. Meist versucht der Verlag dies durch die Vorgabe einer einheitlichen Word-Dokumentvorlage. Trotzdem entsteht häufig ein nicht zu geringer Nachbearbeitungs-Aufwand an den Daten, bevor sie zusammengeführt zu einer Gesamtdatei weiterverarbeitet werden können:

Abb. 4 Je mehr Personen an einem Buchprojekt beteiligt sind, um so wahrscheinlicher ist es, dass der Verlag es mit einer Vielzahl von Datenformaten zu tun bekommt

Einheitliche Textauszeichnung

Wir müssen uns also neben der Zeichencodierung auch um die einheitliche Textauszeichnung kümmern. Und das sollte möglichst nicht nur bezogen auf eine bestimmte Software (Word, InDesign, Quark XPress o. ä.) sein, denn – und damit kommen wir zum dritten Problemkreis – jedes dieser Programme speichert die Daten in einem anderen, proprietären Format ab. Jedes Satzsystem hat intern eine andere Logik; wenn die einzelnen Satzdienstleister des Verlages verschiedene Satzsysteme oder auch nur verschiedene Versionen eines Layoutprogrammes einsetzen, lassen sich selbst durch Vereinheitlichung des Layouts kaum Einsparpotentiale erreichen.

Abb. 5 Ohne systematische Vereinheitlichung der Workflows ist auch bei gleichartigen Publikationen kaum eine Kostenersparnis möglich

Einheitliche Datenbasis

Schon eine neue Programmversion eines Satzsystems kann zu Umbruchverschiebungen bei den bereits erstellten (»Stehsatz-«) Daten führen; wenn in der Zukunft die eingesetzte Software vielleicht gar nicht mehr zur Verfügung steht, kann es passieren, dass die mit viel Aufwand archivierten Daten überhaupt nicht mehr gelesen werden können oder zumindest einem aufwändigen Konvertierungsprozess zugeführt werden müssen.

Abb. 6 Proprietäre Daten sind nicht für die Archivierung gedacht

Wir sehen, es gibt eine ganze Reihe von datentechnischen Problemen zu lösen, selbst dann, wenn das Buch weiterhin im Mittelpunkt des verlegerischen Interesses bleibt und eine Zweitverwertung der Daten nicht unmittelbar angedacht ist.

Kommen wir daher nun erstmalig auf die (datentechnischen) Anforderungen von elektronischen Publikationen zu sprechen. Es wird sich dabei schnell zeigen: Was im Buch-Produktionsprozess an Datenqualität wünschenswert wäre, ist für das elektronische Produkt unbedingte Voraussetzung.