XML-Know How

Beispielprojekt: Steinbachs Naturführer

Die Reihe »Steinbachs Naturführer«, ursprünglich im Mosaik Verlag angesiedelt, wurde vor einiger Zeit vom Verlag Eugen Ulmer in Stuttgart übernommen. Sie besteht aus derzeit 12 Bänden. Die aufwändig produzierten, durchgängig vierfarbigen broschierten Bände weisen einen Umfang von je ca. 192 Seiten auf. Jeder Band behandelt eine Tier- oder Pflanzengruppe (z. B. »Schmetterlinge«, »Wasservögel«, »Wildblumen« oder »Pilze«), teilweise zusammengefasst gegliedert (z. B. »Steinbachs großer Pflanzenführer«). Hinzu kommen einige Bände zu unbelebten Naturerscheinungen (z. B. »Wolken«, »Versteinerungen«). Alle Bände zeichnen sich durch zahlreiche Abbildungen aller Art aus.

Durch die sich teilweise überlappende Inhaltsstruktur der Bände (viele Artikel sind naturgemäß in mehreren Bänden vertreten) bietet sich die Reihe für die Mehrfachverwertung von Inhalten geradezu an.

Für den neu projektierten »Großen Tier- und Pflanzenführer« sollten Artikel aus vielen der vorhandenen Bände zusammengestellt werden. Damit wird ein umfassender Naturführer erstellt, der vom Umfang her weit über den bisherigen Bänden liegt.

Die bisherigen Bände waren im klassischen DTP-Satz entstanden, die Texte lagen in Form von QuarkXPress-Satzdaten vor. Im Rahmen der Produktion des »Großen Tier- und Pflanzenführers« sollte die Datenhaltung, der redaktionelle und der Satzworkflow auf neue Technologien umgestellt werden, die eine effiziente und kostengünstige Mehrfachverwertung der vorhandenen Inhalte auf breiter Basis ermöglichen. Die Kosten sollten dabei nicht höher ausfallen als bei einem klassischen DTP-Workflow. Für den Verlag sollten zudem keine nennenswerten Kosten für die Anschaffung und den Betrieb von spezieller Software anfallen. Mit der Umsetzung all dieser Vorgaben wurde die pagina GmbH beauftragt. Wir entwickelten einen XML-basierten, teilautomatisierten Satz- und Redaktionsworkflow auf der Grundlage von InDesignCS, InCopyCS und Microsoft Excel, der alle diese Bedingungen erfüllt.

Am Anfang des Projektes stand eine gründliche Werkanalyse. Erst auf der Grundlage einer genauen Sichtung des zu verarbeitenden Contents kann eine Entscheidung hinsichtlich des Grades der Automatisierbarkeit und des optimalen Workflows gefällt werden. Gemeinsam war allen Einzelbänden etwa der Aufbau der Doppelseite: Auf den linken Seiten befindet sich der Textteil, aufgelockert durch Kästen und Abbildungen, auf den rechten Seiten die korrespondierenden Fotografien. Jeder Artikel nimmt einen im Gestaltungsraster festgelegten Teil der Seite ein (1/1 Seite, 1/2 Seite, 1/3 Seite, 1/4 Seite, 1/6 Seite). Die Größe der Artikel kann zudem davon abhängig sein, wo auf der Seite der Artikel steht (oben, mittig oder unten).

Auf diese Weise konnte ein gutes Dutzend verschiedener Artikeltypen festgelegt werden. Ähnlich verhielt es sich mit den korrespondierenden Abbildungen. Die Fotografien auf der rechten Seite befinden sich an der gleichen Position im Gestaltungsraster, in dem der zugehörige Text auf der linken Seite steht. Auch die Abbildungen und Kästen innerhalb der Artikeln auf den linken Seiten folgen, was ihre Größe und Positionierung betrifft, meist bestimmten Regeln, so dass hier ebenfalls Typen definiert werden konnten. Allerdings gab es bei Fotografien, Abbildungen und Kästen im Text eine Reihe von Ausnahmen, die keinem der häufig vorkommenden Typen entsprechen.

Beispiel einer Doppelseite aus »Steinbachs Naturführer«

Aus der Analyse wurde klar, dass eine weitgehende Automatisierung des Satzes möglich ist. Der dadurch mögliche Kostenvorteil rechtfertigt die Fixkosten, die für die Umstellung der Datenhaltung und des redaktionellen Workflows auf XML entstehen. Auch die Grenzen der Automatisierung wurden früh erkannt: Sie ergeben sich einerseits durch die genannten Ausnahmefälle, andererseits dadurch, dass die notwendige Kürzung vieler Artikel eine teilweise manuelle Neuformatierung notwendig macht. Eine Kombination von Automatisierung und manuellem Layout war also unumgänglich.

Im Vergleich verschiedener Workflow-Modelle konnten die Projektverantwortlichen bei pagina rasch nachweisen, dass die Anforderungen am besten durch einen XML-Workflow gelöst werden können. Am Anfang der Umsetzung stand daher die Erstellung einer XML-DTD für den Textteil und die Referenzierung der Grafiken. Dabei wurde nicht nur der Inhalt der Artikel beschrieben, sondern auch der Artikeltyp und die Typen der dazugehörigen Grafiken, ihre Legenden sowie ihre Position auf der Seite.

In einem anschließenden Konvertierungsschritt wurden die alten Quark-Daten nach XML gemäß dieser DTD überführt. Ebenso wurden im Anhang befindliche Stichworte und Angaben zu den Rechteinhabern der Abbildungen den Artikeln zugeordnet. Jeder XML-Artikel enthält also in XML codiert alle Angaben, die für eine spätere Verwendung in einem neuen Kontext relevant sein könnten.

Gleichzeitig wurden alle Grafiken durch Nachbearbeitung normiert, um ihre automatische Verwendung im Satz zu erleichtern.

Einen weiteren wichtigen Arbeitsschritt stellte die Auswahl der Artikel für das neue Produkt dar. Auch diese war nach der Umstellung auf XML mit hohem Automatisierungsgrad möglich: Mit Hilfe einer von pagina programmierten Excel-Anwendung konnten die zuständigen Lektorinnen bei der Auswahl der Artikel auf zahlreiche redaktionelle Hilfen zugreifen, etwa die kontinuierliche Berechnung des voraussichtlichen Gesamtumfangs des Werkes. Neben der Auswahl der Artikel ermöglicht das System auch deren Sortierung. Zudem ist bei Artikeln, die in gekürzter Form übernommen werden, die Angabe des Artikeltyps und die Auswahl der Abbildungen möglich, die in das neue Produkt übernommen werden sollen.

Weiterhin wird die Auswahl während der Bearbeitung auf Plausibilität geprüft. Es ist z. B. nicht möglich, einem Artikel, der als Viertelseiter erscheinen soll, mehr oder größere Abbildungen zuzuweisen als auf dem verfügbaren Raum (also der korrespondierenden rechten Seite) Platz finden. Schließlich wird die Sortierung daraufhin überprüft, ob sie eine sinnvolle Seitenfüllung ergibt. Die Auswahl von einem ganzseitigen Artikel, gefolgt von zwei Viertelseitern und dann wieder einem Ganzseiter ist nicht möglich, da diese Reihenfolge keine sinnvolle Seitenfüllung ergibt. So wird garantiert, dass das Groblayout auf Grundlage der redaktionell bearbeiteten Excel-Liste ohne weitere Handeingriffe automatisiert erstellt werden kann, da alle Seiten bereits abstrakt in Excel vorskizziert wurden.

Für den ersten Satzlauf wurden die XML-Artikel auf Grundlage der Excel-Auswahlliste automatisch zusammengestellt und gemeinsam mit den ausgewählten Abbildungen skriptgesteuert in InDesign gesetzt. Damit liegt ein vollautomatisch erstellter Rohsatz vor, der von der Anordnung der Texte und Abbildungen sowie der Typografie bereits allen Anforderungen gerecht wird. Die außerhalb des Layouts gekürzten Artikel hingegen werden in diesem Arbeitsschritt noch nicht optimal die einzelnen Textrahmen füllen – hier ist also redaktionelle Nacharbeit erforderlich.

Die daraus folgenden Arbeitsgänge können nun durch einen InDesign-InCopy-Workflow parallel ausgeführt werden. Während ein Gestalter den Rohsatz in InDesign Seite für Seite durchgeht und die Abbildungspositionierung wo nötig optimiert, werden – mit direkter Rückmeldung am Bildschirm – die Texte auf die optimale Länge zur Einpassung in die Textrahmen gebracht.

Nach Abschluss dieser Arbeiten liegt das Werk bereits in weitgehend fertiggestellter Form vor.

In einem letzten Bearbeitungsgang werden noch offene Punkte in Text- und Layoutumsetzung geklärt und wiederum in einem InDesign-InCopy-Workflow umgesetzt. Abschließend erfolgt die automatische Erstellung von Inhaltsverzeichnis und Register, die durch den XML-Einsatz ebenfalls deutlich effizienter erfolgt.

Nach Abschluss sämtlicher Arbeiten und dem Erzeugen imprimierter PDFDateien werden wir die XML-Daten wieder aus der InDesign-Anwendung exportieren. Die gekürzte Artikel liegen nun in zwei verschiedenen – der gekürzten und der ursprünglichen – Versionen vor. Aus diesen auskorrigierten und extrem hochwertigen XML-Daten können nun mit geringem Aufwand weitere Print-Produkte oder auch EP-Produkte erzeugt werden.

Die Möglichkeiten und Vielfalt der Mehrfachnutzung sind dabei noch bei weitem nicht ausgeschöpft. Doch die Optionen, quasi auf Knopfdruck regionale Führer (»Tier- und Pflanzenwelt der Alpen«), saisonale Führer (»Die Tierwelt im Winter«) oder elektronische Spin-Offs zu erzeugen, bis hin zum Vermarkten des gesamten Contents für den Online-Auftritt etwa von Fremdenverkehrsvereinen (»Welche Tiere kann der Wanderer in Berchtesgaden im August erblicken« o. ä.), wecken Hoffnung und Neugier auf neue Märkte und neue Verwertungschancen der Inhalte. Denn die für die Auswertungen notwendigen Strukturen sind in den Daten nun bereits enthalten – und das ohne Mehrkosten gegenüber konventionellem DTP-Satz.