XML-Know How

XML – eine Auszeichnungssprache

Die extensible Markup Language – zu Deutsch Erweiterbare Auszeichnungssprache – ist also eine Sprache, die der Auszeichnung dient und erweitert werden kann. Was genau bedeutet diese Bezeichnung?

»Auszeichnung« meint hier, was die Verlagsbranche im Zusammenhang mit der Manuskriptarbeit schon immer unter diesem Begriff verstand, nämlich die Kennzeichnung und Hervorhebung von Wörtern oder Textabschnitten im Manuskript. Traditionell können Textelemente auf ganz unterschiedliche Weise markiert werden, z. B. mit Farbstiften, Unterstreichungen u. ä. Da XML eine Auszeichnungssprache ist, werden mit ihr die Auszeichnungen in den Daten, und zwar in Textform, vorgenommen. »Erweiterbarkeit« bedeutet, dass der Anwender nicht auf ein vorgegebenes Muster von Auszeichnungen beschränkt ist, sondern die Auszeichnungen selbst festlegen kann.

XML ist also im weitesten Sinne ein textbasiertes Datenformat, in dem Texte, Grafiken usw. wiederum mit Text beschrieben werden. Um Texte als Inhalt selbst und Texte als Auszeichnungen (Markup) unterscheiden zu können, wird der Auszeichnungstext bei >XML mit spitzen Klammern umgeben. Diese Klammern mit dem darin stehenden Text nennt man Tags.

Tags vs. Elemente

Ein XML-Element ist alles vom Element-Start-Tag bis zum Ende-Tag, jeweils inklusive.

Element und Tag sind also nicht dasselbe, obwohl sie umgangssprachlich häufig so verwendet werden

Ein Element kann enthalten:

  • Andere Elemente
  • Text
  • Attribute (siehe S. 35), Processing Instructions, Kommentare
  • Eine Mischung aus all dem.

Ein Element zu verarbeiten ist also etwas grundsätzlich anderes, als ein Tag zu verarbeiten.