XML-Know How

Exkurs: Standard-Entities in XML

Im Kapitel über Unicode haben wir ein Zeichencodierungsverfahren kennengelernt, das plattformneutral ist, ohne die »Sonderzeichen« als Entities codieren zu müssen. Das heißt jedoch nicht, dass es in XML keine Entities gäbe: Zum einen ist es jederzeit möglich, eigene Sonderzeichen (über Entities) zu definieren, die nicht Bestandteil von Unicode sind. Zum anderen gibt es innerhalb von XML fünf Standard-Entities, die immer gültig sind. Möchte man nämlich z. B. ein »kleiner-als«-Zeichen (»<«) am Bildschirm sichtbar machen, so kann man nicht einfach ein »<«-Zeichen in die XML-Daten schreiben: Der Prozessor würde dieses als Beginn eines Tags interpretieren und einen Verstoß gegen die Regeln der Wohlgeformtheit melden.

Um dies zu vermeiden, müssen bestimmte Zeichen, die in XML als Steuerzeichen verwendet werden, codiert werden, wenn sie am Bildschirm / im Ausdruck dargestellt werden sollen.

Diese lauten:

Die fünf Standard-
Entities in XML

Standard-Entity

Bedeutung

Zeichenentsprechung

&lt;

»less than«

<

&gt;

»greater than«

>

&amp;

»ampersand«

&

&quot;

»quotation«

"

&apos;

»apostrophe«