XML-Know How

Sonderzeichen-Referenztabellen

Kennen Sie diese Situationen?

- Bei der Konvertierung von gelieferten Daten sind auf einmal die Sonderzeichen verschwunden oder in kryptische Zeichenfolgen verwandelt.

- Ein Autor ruft an und beschreibt Ihnen wortreich das Aussehen eines ungewöhnlichen Zeichens.

- Sie bekommen einen Unicode-codierten Text und haben keine Vorstellung, was sich hinter dem Zeichen »x0388« verbirgt.

Noch für lange Zeit werden Konvertierungs-Probleme zum leidigen Alltag in der graphischen Industrie gehören. Zwar sind die neuen Betriebssysteme intern mittlerweile Unicode-basiert, doch die Umstellung auf Unicode ist noch längst nicht vollzogen: viele Satzsysteme, ältere Textverarbeitungsprogramme und Browser unterstützen diesen neuen Standard der Zeichencodierung nicht. Der überwiegende Teil der im Umlauf befindlichen Dokumente – einschließlich weiter Teile der im Internet kursierenden Dateien – ist nach wie vor ASCII-basiert. Und nicht zuletzt bilden die am Markt befindlichen Schriften immer nur einen Teil des Unicode-Standards ab.

Die nachfolgenden Referenztabellen sollen Ihnen den Produktionsalltag erleichtern und die Kommunikation mit Autoren und technischen Betrieben vereinfachen und präzisieren.

Die Tabellen geben jeweils das Sonderzeichen in seiner graphischen Form, in Unicode-Codierung und in der Schreibweise als ISO- bzw. XHTML-Entity wieder. Außerdem finden Sie eine präzise deutschsprachige Beschreibung des Zeichens sowie die Angabe, in welcher Entity-Liste das Zeichen zu finden ist.

Für diese Lieferung haben wir uns für die lateinischen, (neu)griechischen und kyrillischen Zeichensätze entschieden, präzise gesagt für die Zeichen, die in den ISO-Entity-Listen iso-lat1, iso-lat2, iso-grk1, iso-grk2, iso-grk3, iso-dia, iso-cyr1, iso-cyr2 und in den Listen der XHTML Character Entities xhtml-lat1.ent, xhtml-special.ent und xhtml-symbol.ent enthalten sind.

Die Listen sind nach drei Kriterien sortiert:

Zunächst (alphabetisch) nach dem Zeichen in seiner graphischen Form (getrennt nach lateinischen, griechischen und kyrillischen Zeichen). Bitte beachten Sie, dass die Sortierung im Griechischen und Kyrillischen von der lateinischen Umschrift abweichen kann! Diese Listen können Ihnen z. B. in der Kommunikation mit dem technischen Betrieb helfen, ein Zeichen, dessen graphische Form Sie kennen, präzise zu beschreiben (»Nehmen Sie bitte das Zeichen mit der Unicode-Adresse x00C7«). Auch für die Codierung von Sonderzeichen in HTML (hier verwenden Sie das Entity) leistet Ihnen diese Liste gute Dienste.

Danach finden Sie die selben Zeichen aufsteigend sortiert nach der Unicode-Codierung. So können Sie Zeichen, die Sie am Bildschirm nur im Quellcode der Unicode-Codierung sehen, schnell zuordnen. Diese Liste stellt den Gegenpart zu der oben genannten Zeichen-sortierten Liste dar, hilft also auch für die Kommunikation in der umgekehrten Richtung: Kann Ihnen ein Kollege oder Dienstleister ein Zeichen präzise nur als Unicode beschreiben, so haben Sie sofort das passende Zeichen vor Augen.

Als dritte Liste haben wir die Zeichen nach den Entity-Namen aufsteigend sortiert. Bei Dateien, die in SGML (also auch HTML) vorliegen, können Sie mit dieser Liste schnell die Entities den entsprechenden Zeichen zuordnen.

Wir hoffen, Ihnen mit diesen Listen, die wir in dieser Zusammenstellung und deutscher Übersetzung so nirgendwo gefunden haben, eine weitere Hilfe für Ihre tägliche praktische Arbeit an die Hand gegeben zu haben.

Liste der lateinischen ISO- und XHTML-Sonderzeichen, sortiert nach Zeichen

(Ausgewertete Listen: iso-lat1, iso-lat2 und xhtml-lat1)

Die nachfolgende Liste beschreibt die auf lateinischen Grundbuchstaben basierenden Sonderzeichen in alphabetischer Reihenfolge. Das Basisalphabet selbst (also die Grundbuchstaben) ist nicht in der Liste enthalten, da diese Zeichen auch keine Entity-Entsprechung in den jeweiligen ISO- bzw. XHTML-Listen haben.

Liste des (neu)griechischen Alphabets, sortiert nach Zeichen

(Ausgewertete Listen: iso-grk1 bis iso-grk3 und die Buchstaben aus xhtml-sym)

Sie enthält das neugriechische Alphabet mit den entsprechenden Akzent- und Sonderbuchstaben in alphabetischer Reihenfolge. Bitte beachten Sie, dass das griechische Sortieralphabet von dem des Lateinischen abweicht.

Liste des kyrillischen Alphabets (inkl. belorussisch, serbisch, ukrainisch, makedonisch), sortiert nach Zeichen

(Ausgewertete Listen: iso-cyr1 und iso-cyr2)

Die nachfolgende Liste enthält das kyrillische Alphabet mit den entsprechenden Akzent- und Sonderbuchstaben in alphabetischer Reihenfolge. Bitte beachten Sie, dass das kyrillische Sortieralphabet von dem des Lateinischen abweicht.

Liste der Symbole

Die Liste enthält die Nicht-Buchstaben-Zeichen aus den o.g. ISO- und XHTML-Listen, sortiert nach Unicode.

Sonderzeichen-Referenztabelle, sortiert nach Unicode

Sie enthält die Sonderzeichen der o. g. ISO- und XHTML-Entity-Listen sortiert nach den zugehörigen Unicodes der Zeichen. In dieser Liste tauchen viele Unicodes mehrfach auf. In diesen Fällen ist die Differenzierung im ISO- bzw. XHTML-Code feiner als in Unicode (die graphische Darstellung des Zeichens ist in diesen Fällen jedoch jeweils die gleiche). Bitte konsultieren Sie in solchen Fällen die Spalte mit der Beschreibung des Zeichens, um zu dem von Ihnen benötigten Code zu gelangen.

Sonderzeichen-Referenztabelle, sortiert nach Entity-Namen

Die nachfolgende Liste enthält die Sonderzeichen aller o. g. ISO- und XHTML-Entity-Listen, alphabetisch aufsteigend nach den Entity-Namen sortiert. Der dritten Spalte können Sie entnehmen, aus welcher der Listen die jeweiligen Entities stammen.