XML-Know How

Standard-DTDs

Neben HTML gibt es mittlerweile viele Standard-DTDs für die unterschiedlichsten Interessengruppen. Beispiele hierfür sind NITF (News Industry Text Format) für den Informationsaustausch zwischen Nachrichtenagenturen, DocBook für technische Dokumentationen allgemein, TEI (Text Encoding Initiative) für Texte in den Geisteswissenschaften, ISO 12 083 für die Kodierung von wissenschaftlichen Texten im Verlagskontext. Für jeden Standard gibt es eine DTD bzw. XSD, die festlegt, welche Elemente ein Dokument haben darf oder muss und wie diese angeordnet sein müssen.

Auch für Buch-Metadaten gibt es einen solchen Standard. ONIX (Online Information eXchange) ist ein XML-basierter Standard für den Austausch von Produktinformationen in der Verlagsbranche.

Info

ONIX wurde 1999 von der American Association of Publishers (AAP) in Zusammenarbeit mit großen Verlagen, Buchhändlern und Informationsservices entwickelt, um ausführlichere Buchinformationen online in einem von allen lesbaren Format zur Verfügung stellen zu können.

Mit ONIX liegt Verlagen eine Reihe von vorgegebenen Datenfeldern für die Produktbeschreibung vor, die zum Teil zwingend erforderlich, zum Teil optional sind. Dabei handelt es sich nicht nur um Text- und Zahlenfelder wie für Titel, Autor oder ISBN, sondern auch um Felder für multimediale Eingaben wie z. B. Abbildungen der Buchcover oder Audiodateien. Diese Daten werden dann als ONIX-Nachricht an ein entsprechendes Katalogsystem gesandt. Der Vorteil für den Verlag: Wenn alle Kataloge diesen Standard lesen können, müssen Eingaben nur noch einmal gemacht werden, nicht wie bisher für jeden Katalog einzeln.

Ein Verlag, der sich für den Einsatz von XML entscheidet, steht damit vor der Frage, nach welcher Grammatik die Daten strukturiert sein sollen: Kann eine der erprobten und häufig kostenlosen Standard-DTDs zum Einsatz kommen oder benötigt der Verlag eine eigene »Haus-DTD«?

Aufwand und Nutzen hier gegeneinander abzuwägen bedarf immer einer Betrachtung des Einzelfalls. Für den einen Verlag mag es wichtig sein, v. a. für die redaktionelle Unterstützung die Spezifika des eigenen Verlagsprogramms präzise abgebildet zu wissen (was für eine Eigenentwicklung spräche), für den anderen ist der problemlose Austausch der Daten in der wissenschaftlichen Gemeinde wichtiger, so dass möglicherweise eine Standard-DTD zum Einsatz kommen sollte.

Wenn eine Standard-Grammatik zur präzisen Abbildung der Verlagsinhalte vollständig ausreicht, sprechen vor allem Kostengründe und die kürzeren Implementierungszeiten dafür, sich dieses Standards zu bedienen. Auch gibt es eine breite Unterstützung des offenen Standards durch Drittsoftware, auf die der Verlag zurückgreifen kann.