XML-Know How

Allgemeine Anforderungen an medienneutrale Daten

Grundvoraussetzung für die Mehrfachverwendung von Daten ist zunächst ein fehlerfreier Datenbestand. Dieser muss in einer Form vorgehalten werden, die für alle gewünschten Publikationsformen als Quelldatenformat dienen kann. Eine weitere wichtige Anforderung ist die sogenannte Plattformneutralität: die Daten müssen auf allen Computersystemen verwendbar sein.

Ebenso wichtig ist Herstellerunabhängigkeit, was meint, dass das Format nicht an Hard- oder Software eines bestimmten Herstellers gekoppelt ist und somit in einem für alle Interessierten lesbaren Format vorliegt. Als letzte Forderung auf der Suche nach einem universellen Kodierungssystem steht die sog. Sprachunabhängigkeit. »Sprache« bezieht sich hier auf »Programmiersprache« – es wird also nach einem Datenformat gesucht, auf das prinzipiell mit beliebigen Programmiersprachen zugegriffen werden kann.

So hoch diese Anforderungen sind, sie sind doch nur notwendige technische Voraussetzung für alle nachfolgenden verlegerischen Aktivitäten und keineswegs schon das eigentliche Ziel. Denn auch Daten, die überall technisch lesbar sind, sind damit noch nicht zwangsläufig sinnvoll recherchierbar oder in verschiedenen Medien ausgebbar.

Eine einfache Textdatei beispielsweise wird häufig den Anspruch der System­unabhängigkeit erfüllen. Aber sie kann nur per einfacher Volltextsuche durchsucht und nur durch aufwändige manuelle Nacharbeit formatiert werden, da schon einfachste Gliederungselemente wie z. B. Überschriften nicht als solche in den Daten gekennzeichnet sind und damit nicht automatisiert verarbeitet werden können.

Man kann also noch einen weiteren Anspruch an die Daten hinzufügen, nämlich die Möglichkeit, diese gemäß ihren spezifischen Inhalten und Strukturen automatisch auszuwerten. Das bezieht sich nicht nur auf elektronische ­Publikationen, sondern selbstverständlich auch auf den gesamten Bereich der Druckvorstufe, also das Formatieren der Texte.