XML-Know How

XML- die Dinge beim Namen nennen

Aber XML hat noch eine weitere Dimension. An den Beispielen oben wurde schon deutlich, dass Inhalte mit XML sprachlich explizit gekennzeichnet werden können: ein Personenname kann in <personenname>-Tags gestellt werden. Die Art des Inhalts wird also sprechend beschrieben. Diese Art der Auszeichnung nennt man semantische Auszeichnung. Sie bringt erhebliche Vorteile gerade bei der Verwertung von textlichen Inhalten mit sich.

Semantische Auszeichnungen sind aussagekräftiger als beispielsweise typographische, da in ihnen selbsterklärende und eindeutige Informationen abgelegt werden können. So ermöglichen semantische Auszeichnungen eine inhaltsorientierte Auswertung, sei es für komplexe Suchalgorithmen oder beliebige inhaltliche oder statistische Analysen.

Ein Beispiel: Die Volltextsuche nach einer Person mit dem Nachnamen »Schwerin« wird auch den Ortsnamen »Schwerin« auswerfen, sofern dieser im Text vorkommt. Eine einfache Volltextsuche wird also mangelhaft präzise sein. Bei einer Suche im XML-Datenbestand können Sie zusätzlich zur Angabe des Suchtextes angeben, in welchem Element der Text stehen soll. Den Herrn Schwerin würden Sie also als »Schwerin« in Element <personenname> suchen. Die Treffer werden viel genauer sein. Natürlich können Sie auch dann auch komplexe Suchen starten, wie z. B. »Schwerin« in Element <personenname> im <kapitel> mit der <überschrift> »Deutsche Autoren«.

Typografische Auszeichnung ist im Gegensatz zur semantischen auf wenige Varianten beschränkt. Bei komplexen Inhalten müssen unterschiedliche Inhalte oft typografisch gleich dargestellt werden (z. B. Kursivierung gleichermaßen für Orts- und Personennamen). Der Informationsgehalt typografischer Auszeichnungen ist dann nicht eindeutig und fast immer interpretationsbedürftig.

Die Ausgabe von semantisch kodierten Texten geschieht durch automatische Umwandlung der Tags und ihrer Attribute in medienspezifische Auszeichnungen. Dazu stehen entsprechende Software-Anwendungen zur Verfügung. Text, der in XML als <personenname> gekennzeichnet ist, kann z. B. im Print kursiv erscheinen und bei der Bildschirmausgabe im Internet farbig wiedergegeben werden. XML-Verweise können bei elektronischen Produkten als Links realisiert werden, im Print werden daraus automatisch Seitenverweise erzeugt.