XML-Know How

Das Einfache, das so schwierig ist – Die Konvertierung von Satzdaten

Spätestens, wenn es um die Umstellung ganzer Buchreihen, Zeitschriften oder gar ganzer Redaktionen auf medienneutrale Datenhaltung geht, muss in der Regel auch ein vorhandener Bestand an Satzdaten konvertiert werden. Dieser Arbeitsschritt bietet immer wieder auch unliebsame Überraschungen. Viele Aspekte und Feinheiten müssen dabei beachtet werden. Wir sagen Ihnen, welche.

Die Konvertierung von Daten ist oft eine ungeliebte Notwendigkeit. Das verwundert nicht: trotz mitunter hoher Kosten lassen sich diesem Arbeitsschritt unmittelbar keine positiven Deckungsbeiträge zuordnen. Es liegt daher nahe, die Kosten für diese Position soweit wie irgend möglich zu minimieren. Doch häufig wird hier am falschen Ende gespart: bei der Konvertierung unzureichend ausgezeichnete und strukturierte Daten müssen später für ein Vielfaches der gesparten Kosten in Redaktion und Lektorat nachgearbeitet werden, ein automatischer Neuumbruch ist nicht möglich, eine Übernahme in die elektronische Publikation scheitert.

An die Konvertierung ist daher der gleiche Anspruch zu stellen wie an die Neuerstellung von XML-Daten: Alle Informationen struktureller wie inhaltlicher Art, die Sie für die Herstellung Ihrer Zielprodukte benötigen, müssen sich in verlässlicher Form schon in den konvertierten Daten wieder finden. Wo dies nicht möglich ist, z. B. weil die Satzdaten die entsprechenden Informationen schlicht nicht erhalten, muss Zeit und Aufwand für Nacharbeiten nach der eigentlichen Konvertierung einkalkuliert werden.

Als Faustregel gilt: Der Aufwand für die Konvertierung von Satzdaten steigt und fällt mit der Komplexität des Satzes. Ein glatter Romansatz wird zu sehr geringen Kosten nach XML konvertiert werden können. Bei einem wissenschaftlichen Werk mit Sonderzeichen, Formeln, Fußnoten, Marginalien, Tabellen usw. können die Konvertierungskosten die Satzkosten sogar übersteigen.

Daneben spielen zwei weitere Aspekte eine entscheidende Rolle: Die Qualität der Quelldaten und die Struktur der Zieldaten.

Qualität der Quelldaten meint vor allem Eindeutigkeit und Einheitlichkeit der Kodierungen sowie ihre Lesbarkeit für das Konvertierprogramm. Ist das Dateiformat des Satzprogramms so konzipiert, dass es ohne Konvertierungsschritte nur von diesem Programm gelesen werden kann und verfügt das Satzprogramm nur über unzureichende Exportfunktionen (beides trifft leider auf viele weit verbreitete Produkte zu), wird die Konvertierung schon eingangs Probleme verursachen.

Die technische Qualität der Quelldaten hängt also unmittelbar von der Art des verwendeten Satzsystems ab. Für die Produktplanung bedeutet das: Auch wenn bei einem Printprodukt noch offen ist, ob die Satzdaten später weiterverwendet werden sollen, ist die Wahl eines Satzsystems, das die Daten konsistent, leicht konvertierbar und mit sämtlichen Strukturinformationen exportieren kann, immer die strategisch richtige Entscheidung.

Weiter gilt: Je komplexer die Struktur der Zieldaten, desto aufwändiger die Konvertierung. Daher liegt die Versuchung nahe, die Zieldaten möglichst einfach zu strukturieren. Spätestens, wenn aus diesen Daten wieder komplexer Satz erzeugt werden soll, wird sich aber zeigen, dass die Ersparnisse bei der Konvertierung durch erhöhte Satzkosten wieder verloren gehen, da ja die verlorenen Informationen nachträglich wieder eingegeben werden müssen, im ungünstigsten Fall sogar eine Neukonvertierung nötig wird.

Bevor also die Konvertierung in Angriff genommen werden kann, muss durch eine detaillierte Analyse der Werkstruktur und eine Festlegung der zukünftigen Verwertungsarten eine DTD erstellt werden, die nicht primär auf eine einfache Konvertierung, sondern auf eine ebenso effektive wie hochwertige Weiterverwertbarkeit der Daten zielt. (Mehr zu diesem Thema lesen Sie im Beitrag Dokumentenstrukturierung in XML).