XML-Know How

Ein E-Book automatisiert erstellen

Es gibt verschiedene Wege, ein EPUB zu erstellen. Eher für den »Heimanwender« gedacht und geeignet sind die Konverter, die beispielsweise InDesign direkt anbietet, um aus einer Layout-Datei ein EPUB herauszuschreiben. Ähnliche Konverter gibt es auch, um Word-Daten direkt nach EPUB zu überführen.

Beide Verfahren sind im Ergebnis sehr stark davon abhängig, wie die Quelldaten aufgebaut sind – sind die InDesign-Daten nicht sehr systematisch mit Stilvorlagen erstellt und sämtliche Textrahmen korrekt verknüpft, ist das Ergebnis nicht vorhersehbar und erfordert meist einen hohen Grad an Nacharbeit und Qualitätssicherung. Viele Verlage, die noch nicht über einen XML-Workflow verfügen, vergeben daher die E-Book-Produktion an Dienstleister, die genau diese Arbeiten übernehmen.

Nachteile einer nachgelagerten E-Book-Produktion

So pragmatisch dieses Vorgehen ist, so viele Nachteile bringt es auch mit sich. Ein E-Book zu erstellen, verursacht bei der nachgelagerten Produktion teilweise nochmals einen ähnlich hohen Aufwand wie die Produktion des Buches selbst. Gleichzeitig lassen sich bei der Methode »erst Print, dann E-Book aus den Printdaten« stets nur E-Books erstellen, die im Wortlaut dem gedruckten Werk entsprechen. Inhaltliche Erweiterungen gegenüber diesem (»enriched E-Books«) sind in der Prozesskette dann zunächst nicht vorgesehen (oder wiederum nur in Handarbeit), solange es keine separate Manuskriptphase für das E-Book gibt. Zu dem Zeitpunkt jedoch, wo das E-Book redaktionell überarbeitet werden könnte, ist die inhaltliche Arbeit am Buch z. T. schon seit Monaten abgeschlossen und der Redakteur bereits mit anderen Werken beschäftigt.

Auch für das Marketing bereitet der späte Zeitpunkt der E-Book-Erstellung zunehmend Probleme: Die immer wichtiger werdenden E-Book-Leseproben können nicht bis nach der Drucklegung warten und müssen vorab und mit ähnlichem Aufwand wie später das eigentliche E-Book erstellt werden.

E-Book-Produktion im Verlag

Der Einstieg in die Produktion und den Vertrieb von E-Books stellt daher für viele Verlage auch den Punkt dar, an dem die internen Abläufe im Verlag überdacht werden und eine XML-basierte Produktionskette eingeführt wird. Liegen die Verlagsinhalte (auch die zusätzlichen Inhalte, die nur für das E-Book vorgesehen sind) nämlich anwendungsneutral in XML vor, so lässt sich ein EPUB / eine EPUB-Leseprobe / eine Kindle-Datei etc. jederzeit aus diesem Datenbestand automatisch erzeugen.

Es stellt sich die Frage, wie dies technisch bewerkstelligt wird. Die XML-Daten des Verlages liegen ja noch nicht in dem gewünschten Zielformat (nämlich HTML) vor und müssen erst in dieses Format überführt werden.

Die Transformation von einem neutralen Quelldatenformat in ein spezifisches Zieldatenformat ist ein Standardvorgang beim crossmedialen Publizieren und der Schlüssel zur raschen und sicheren Ausgabe der Inhalte in die verschiedensten Kanäle. Jedes XML-basierte Verlags-Content-Management-System arbeitet nach dem Prinzip »eine Datenquelle wird automatisiert in verschiedene Ausgabe-Formate überführt«.

Die eigentliche Transformation, also die Überführung einer XML-Struktur in eine andere, wird mittels XSLT durchgeführt (vgl. Kap. 7.1). XSLT ist eine Transformationssprache und ebenso wie XML selbst ein offener W3C-Standard. XSLT kann also auch ohne den Einsatz eines (in der Regel sehr kostenintensiven) Content-Management-Systems eingesetzt werden – alle erforderlichen Bestandteile für den Aufbau einer Transformationsumgebung sind unentgeltlich verfügbar. So können auch kleine Verlage, für die sich ein teures System nicht lohnt, an den Vorteilen eines XML-Workflows partizipieren.

Bei einem gut organisierten crossmedialen XML-First-Workflow werden alle medialen Ausprägungen einer Publikation aus einer Quelle gespeist (Single Source Publishing). Diese Quelle liegt in XML vor.

Abb. 38 Übersicht eines XML-Workflows

Um die XML-Dokumente als EPUB zu veröffentlichen, müssen sie einen zweistufigen Generierungsprozess durchlaufen:

  • Generierung von XHTML- und Steuerdateien
  • Zippen und Überprüfen des EPUB-Dokumentes

In einem ersten Konvertierungs-Schritt werden die XML-Quelldaten mit Hilfe eines XSLT-Skripts nach XHTML überführt. Im einfachsten Fall ist das ein »Suche-Ersetze«-Vorgang (suche nach dem Element <rezept>, ersetze es durch das Element <div class="rezept">); meist sind aber komplexe Umstellungen des Contents notwendig – Neusortierungen, Auswahl von Teilbäumen etc.

Ergebnis eines solchen XSLT-Transformationsprozesses sind neben einzelnen XHTML-Dateien die benötigten Steuerdokumente: die NCX-Datei zur Darstellung eines Inhaltsverzeichnisses und die OPF-Datei zur Darstellung der logischen Dokumentstruktur. Da diese selbst auch wieder XML-Dateien sind, lassen sie sich über XSLT problemlos erzeugen.

Abb. 39 Ablauf der Konvertierung von XML zu EPUB

In einem zweiten Schritt werden die erzeugten Dokumente zusammen mit Abbildungen und den Formatierungsregeln mit einem ZIP-Programm gepackt. Ein abschließender Prüfprozess garantiert die Datenintegrität der Dokumente: Entspricht das EPUB tatsächlich in allen Punkten dem definierten Standard?

E-Book-Leseproben

Wird nun bereits in den XML-Quelldaten der Bereich markiert, der später als Leseprobe gelten soll, so lässt sich auch die Leseprobe vollautomatisch erzeugen. Auch jede andere Ausgabeform der Daten wird möglich, sofern die Quelldaten alle erforderlichen Strukturinformationen enthalten und sich das Zielformat automatisiert daraus ableiten lässt.

Schauen wir uns daher im nächsten Schritt die Technologie XSLT etwas näher an.