XML-Know How

Qualitätssicherung der XML-Daten

Konventionen

Den Abschluss der Konvertierung sollte stets eine systematische Qualitätssicherung der XML-Daten darstellen. Nur wenn die Daten wirklich allen Anforderungen und Vorgaben des Verlages entsprechen, werden die nachgelagerten Satzprozesse automatisiert erfolgen können. Hierfür reicht es nicht aus, dass die Regeln der DTD eingehalten wurden. Vielmehr muss abgeprüft werden, ob von der Vielzahl der zulässigen Elemente auch an jeder Stelle die richtigen eingesetzt worden sind. Daneben gibt es in der Regel eine Reihe von Verlagskonventionen (auch als »Business Rules« bezeichnet), die die korrekte Anwendung der DTD regeln. Typische Beispiele hierfür sind:

  • wann wird eine Struktur als Liste, wann als Tabelle erfasst?
  • eine Überschrift darf nur am Anfang einer neuen Sinneinheit (Kapitel, Infokasten, …) stehen
  • Bildlegenden werden immer mit dem Bild zusammen in einen gemeinsamen Container gestellt
  • Mikrotypographische Festabstände sollen als Unicode-Zeichen in die Daten eingebracht werden

Schematron

Um solche und andere Konventionen abzuprüfen, gibt es eigene Skriptsprachen. Die bekannteste ist Schematron, eine XML-basierte Sprache zur Überprüfung von XML-Dateien nach festzulegenden Regeln. Das Schematron-Skript wird in die Oberfläche des XML-Editors eingebunden und vom Anwender auf Knopfdruck gestartet. Dieser erhält dann ein Fehler/Warnhinweis-Protokoll mit Verstößen gegen die festgelegten Konventionen und kann die Daten entsprechend korrigieren.

Die Konvertierung muss dabei freilich nicht im Verlag stattfinden. Viele Verlage entscheiden sich auch für einen XML-first-Workflow, bei dem die Konvertierung und die Verantwortung für die Datenqualität beim Vorstufen-Dienstleister liegt.

Mit Abschluss der Qualitätssicherung sind die Daten optimal für die automatisierte Satzproduktion vorbereitet. Je nach Verlagsprogramm kommen hierfür die unterschiedlichsten Satzsysteme zum Einsatz – die nicht alle gleich gut mit XML umgehen können und auch den Anspruch an das »Roundtripping« unterschiedlich gut erfüllen.

Betrachten wir daher die verschiedenen Satzsysteme etwas näher.