XML-Know How

XML first – XML last

Auf dem Weg hin zu einem XML-Workflow entscheiden sich fast alle Verlage für ein schrittweises Vorgehen. Selten bewährt es sich, auf einen Schlag sämtliche etablierten Arbeitsweisen in allen Abteilungen einzustellen und alles neu zu definieren. Vielmehr wird anhand erster Pilotprojekte die Machbarkeit evaluiert und anschließend Abteilung für Abteilung in den Workflow integriert. Für ein leichteres Verständnis der nachfolgenden Ausführungen betrachten wir zunächst den klassischen, idealisierten Workflow in den Prozessschritten »Autor – Lektorat – Herstellung – Satz – Druck«.

Abb. 26 Abgrenzung von XML first und XML last: Der Begriff XML first fasst viele verschiedene Workflows zusammen

Abgrenzung XML first – XML last

Prinzipiell ist an jedem Punkt dieser Prozesskette der Wechsel von konventioneller Arbeitsweise auf XML möglich – mit Ausnahme des Drucks, der nur noch eine technische Umsetzung von Daten, nicht jedoch eine Verarbeitung im Sinne von Veränderung derselben darstellt. Eine besondere Zäsur fällt hierbei dem Prozessschritt »Satz« zu. Alle Workflows, die VOR Beginn der Satzarbeiten XML einsetzen, werden zusammenfassend als »XML first« bezeichnet, alle Workflows, bei denen XML erst im Nachhinein entsteht (um z. B. die gedruckten Inhalte auch elektronisch anbieten zu können) als »XML last«.

Ein XML first-Workflow bringt also meist auch Veränderungen in den Abläufen im Verlag mit sich, während »XML last« nur eine nachträgliche Konvertierung von druckfähigen Satzdaten beschreibt.

Doch auch ein XML-last-Verfahren wird massiv erleichtert, wenn die Abläufe im Verlag bereits vorstrukturierte Daten ergeben (z. B. durch den systematischen Einsatz einer Dokumentvorlage in Word und einheitlichen Stilvorlagen im Satzsystem).

Die Entscheidung für XML first oder last ist die erste, grundlegende Festlegung, die ein Verlag auf dem Weg zu XML treffen sollte – bzw. bei der Entscheidung für einen neuen Workflow treffen muss.

Geht man vom Grundgedanken eines Single-Source-Publishings aus, bei dem medienneutrale Daten zur Ausgabe in beliebige Kanäle vorgehalten werden, ist die Unterscheidung in XML first und XML last eigentlich der falsche Ansatz. Denn damit wird die Fertigstellung des Buches (das nur eine Publikationsform von vielen sein sollte) zu dem Meilenstein erhoben, an dem sich der Zeitpunkt der XML-Konvertierung festmacht. Die Idee des crossmedialen Publizierens jedoch sieht diese Unterscheidung nicht mehr vor: Das Buch soll – genau wie alle anderen Medienformen auch – aus einem gemeinsamen Datenbestand entstehen. Entsteht dieser Datenbestand erst nach Abschluss der Arbeiten am Buch, so kann eigentlich nicht von einem XML-Workflow gesprochen werden. Verlage, die den XML-last-Ansatz favorisieren, tun dies entsprechend auch unter der Maßgabe, die Abläufe im Verlag möglichst gar nicht zu verändern und dennoch zu XML-Daten zu kommen. Für bestimmte sehr layoutlastige Produktionen ist dieser Ansatz allerdings durchaus nach wie vor der effektivste – nicht alle Abläufe lassen sich durch den Einsatz von XML verbessern.

Gibt es diese Zwänge nicht, sollte in jedem Fall der XML-first-Ansatz evaluiert werden. Ziel hierbei ist, zunächst medienneutrale Daten vorliegen zu haben und diese auszukorrigieren sowie mit allen Zusatzinformationen anzureichern, die für den Verlag selbst (z. B. organisatorische Metadaten) oder jedwede Produktform (in der z. B. Schlagworte, Querverweise, Videosequenzen etc. zu kodieren sind) von Belang sind. Wird im Weiteren von einem XML-Workflow gesprochen, so ist stets der XML-first-Workflow gemeint.

Die Einführung eines solchen XML-Workflows beinhaltet nicht zwingend die Veränderung der technischen Abläufe im Verlag. Denn – wie die Abbildung 26 zeigt – kann die Umsetzung der Daten nach XML auch nach Abschluss der Lektoratsphase, aber vor Beginn der Satzarbeiten erfolgen. Viele Verlage favorisieren diesen Weg als Einstieg in die neuen Technologien. In diesem Fall wird von der Setzerei oder einem separaten Dienstleister die Konvertierung der (Manuskript-)Daten nach XML vorgenommen.

Unterschiede bei der Qualitätssicherung

Die Unterscheidung »erst XML – dann Satz« bzw. »erst Satz – dann XML« ist keineswegs Augenwischerei, obwohl der Verlag als Auftraggeber davon ja in beiden Fällen nichts mitbekommen sollte. Entscheidend ist der Aspekt, dass auch die XML-Daten qualitätsgesichert werden müssen. Erfolgt die Konvertierung nach XML erst nach Abschluss der Satzarbeiten, so müssen diese Arbeiten irgendwie überprüft werden. Da ein Korrekturlesen in der XML-Datei praktisch entfällt, muss also eine erneute Umsetzung der Daten in eine lesbare Form erfolgen – Formatierung und Korrekturlesen erfolgen also zweimal: einmal für die eigentlichen Satzarbeiten, ein weiteres mal für die Kontrolle der Konvertierung.

Abb. 27 Abgrenzung von XML first und XML last im Kontext der Trennung von Struktur und Layout

Ganz anders sieht es aus, wenn die Daten vor Beginn der Satzarbeiten konvertiert werden. Da mit Vorhandensein von XML auch entsprechende Satzautomatismen greifen, kann anhand der typographischen Umsetzung im Satzbild die korrekte Struktur der Daten gleich mit überprüft werden. Eine falsch gewählte Überschriftshierarchie ist dann kein Hinweis auf eine falsche (manuelle) Umsetzung des Textes durch den Satzbetrieb, sondern auf eine falsche Struktur in den Quelldaten. Wenn während der Satzarbeiten immer die Quelldaten korrigiert werden, liegen mit dem Imprimatur auch auskorrigierte, valide XML-Daten vor. Der Verlag hat sein strategisches Ziel somit erreicht, ohne dass sich an den Abläufen im Haus (Korrekturlesen auf Papier, Arbeiten am Manuskript etc.) irgendetwas geändert hätte.

Tipp

Um bei mehreren Satzdienstleistern eine einheitliche Datenqualität zu erzielen, gehen immer mehr Verlage dazu über, die Konvertierung der Daten nach XML als eigenen Prozessschritt separat zu beauftragen. Spezialisierte Betriebe übernehmen dann die Aufbereitung der Inhalte nach XML – inklusive dem notwendigen Copy-Editing, um Querverweise etc. einzubringen. Meist werden hier auch bereits die typographischen Konventionen des Verlages in der Datenstruktur berücksichtigt, z. B. Versalzeichenfolgen als solche gekennzeichnet oder Festabstände (als Unicode-Zeichen) in die Daten eingebracht.

Sind solcherart veredelte und strukturell fehlerfreie Daten vorhanden, sinkt der Aufwand für die eigentlichen Satzarbeiten natürlich beträchtlich (diese hatten bis dato ja ebenfalls mit einer Konvertierung der Daten begonnen), so dass sich die Einführung einer zentralen Konvertierung nicht zwingend negativ auf die Gesamtkosten niederschlägt.

Bereits zu diesem Zeitpunkt ist der Verlag in der Lage, jede Form von elektronischen Publikationen aus den Daten abzuleiten. Mit Abschluss der Satzarbeiten sollten auskorrigierte XML-Daten vorliegen, die sofort als Quelldaten für die weiteren Publikationsformen verwendet werden können. Je »buch-ähnlicher« die Umsetzung der E-Publikation ist, umso tragfähiger ist dieser Workflow, der seitens des Verlages noch ohne größere Investition auskommt.