XML-Know How

XML als Format medienneutrale Daten

Gesucht wird also nach einem Datenformat, das neben den eigentlichen Inhalten (der »geistigen Substanz«, also dem, was der Autor verfasst hat) auch die Struktur der Texte wiedergibt. Auf der Suche nach diesem »Alleskönner«-Datenformat gab es die unterschiedlichsten Ansätze. Viele davon waren erfolgversprechend – doch nur ein Format konnte sich wirklich durchsetzen. Das liegt in der Natur der Sache: Neben allen oben genannten Ansprüchen besteht nämlich noch ein weiterer, nämlich der des Standards. Viele Dateiformate können medienneutral sein, doch wenn die Regeln dieses Dateiformats niemandem bekannt sind, ist der Aufwand der Dokumentation und vor allem der Anpassung von Software an das jeweilige Format horrend. Nur ein Standard, der hinreichend weite Verbreitung findet, kann zum Erfolg führen.

Ein erster solcher Standard wurde 1986 geschaffen: Die Standard Generalized Markup Language (SGML) trägt bereits im Namen, was sie leisten soll: Eine Auszeichnungssprache zu sein, die alle auf der Welt befindlichen Texte beliebiger Sprache strukturieren kann. Da SGML sich für viele Anwender als zu komplex erwies, hat sich XML (Extensible Markup Language), eine vereinfachte Variante von SGML und seit 1998 definiert, für die inhaltliche und strukturelle Kodierung medienneutraler Daten durchgesetzt.