VAD

Unicode – Schriftzeichen (Teil 5)

/

/

Unicode – Schriftzeichen (Teil 5)

Einen interaktiven Abspann aller bisher aufgenommenen 137.374 Unicode-Schriftzeichen, die in 285 Blöcken aufgelistet sind und momentan 146 Schriften aus aller Welt beinhalten (Stand 2018), kann man auf der Webseite von Babelstone anschauen. (Die hexadezimale Kodierung für die Schriftzeichen läuft ebenfalls mit durch den Abspann.) 

Weitere Suchmöglichkeiten

Eine ungefähre Vorstellung, wo sich die verschiedenen Zeichenblöcke in Unicode befinden, ob weiter vorne oder weiter hinten, bietet ein Blick auf eine Übersicht.

In der Unicodezeichen-Tabelle von „Sa•design“ kann man auch nach den hexadezimalen Codes für Unicode-Zeichen bis einschließlich der Unicode-Version 10.0.0 von 2017 browsen, indem man durch die Tabelle scrollt. Wenn man anschließend mit dem Cursor der Maus auf das gewünschte Schriftzeichen klickt, öffnet sich ein weiteres Feld. Dort steht unter der Großdarstellung des Schriftzeichens die Angabe des hexadezimalen Codes:

Unicode (hexadecimal), unicode-table.com (Sa•design 2017). CC: AN 2018, BY-NC-SA.

In der Tabelle von „Sa•design“ kann man die gesuchten Schriftzeichen auch nach Blöcken von zusammengehörigen Zeichen bestimmter Schriftsysteme ausfindig machen. Klickt man auf diesen Blocktafeln den jeweiligen Buchstaben an, erscheint der zugehörige hexadezimale Code, den man zur Eingabe im eigenen Word-Dokument verwenden kann, bzw. die Möglichkeit, das Zeichen über „copy and paste“ in das eigene Dokument einzufügen.

Unicode (hexadecimal), with „copy and paste” option, unicode-table.com (Sa•design 2017). CC: AN 2018, BY-NC-SA.

Die Software „BabelMap“, mit der man durch das Unicodezeichen-Repertoire browsen kann,  zeigt jeweils unten links unter der Schriftenanzeige den zugehörigen hexadezimalen Code zu dem Zeichen an, das man oben mit der Maustaste markiert:

Unicode (hexadecimal) in BabelMap Version 11.0.0.1, 2018. CC: AN 2018, BY-NC-SA.

Das Online-Tool „BabelMap Online (Unicode 11.0)“ bietet auch für die hexadezimalen Codes eine gute Alternative zur Programmversion von BabelMap.

Auf ScriptSource (von SIL) kann man ebenfalls nach den hexadezimalen Verschlüsselungen suchen, alphabetisch nach Sprachen beziehungsweise Schriftsystemen geordnet. Eine alphabetisch geordnete Übersicht von auf lateinischen Schriften beruhenden diakritischen Zeichen findet man darüber hinaus noch auf weiteren Webseiten.

In „Unicode Lookup“ (2009) findet man die hexadezimalen Kodierungen in der dritten Spalte unter „Hex“:

Unicode (hexadecimal) in Unicode Lookup (2009), unicodelookup.com. CC: AN 2018, BY-NC-SA.

Auf der Webseite von InternationalPhoneticAlphabet.org (2017) schließlich findet man Kodierungen für das Internationale Phonetische Alphabet (IPA) ebenso in hexadezimaler Form. Die Hexadezimalangaben stehen jeweils hinter dem Symbol des Schriftzeichens, in der dritten Spalte, unter „hex“.

Tastatureingaben im Unicode-Hexadezimalsystem („Alt“+„C“)

Hat man die in diesen Tabellen aufgelisteten Schriftzeichen gefunden, so gibt man am besten mit der Kombination „U+“ den jeweiligen zugehörigen hexadezimalen Code in seinen Word-Text ein, läßt den Cursor unmittelbar rechts daneben stehen, und drückt dann gleichzeitig die „Alt“-Taste und die „C“-Taste. Läßt man beide Tasten los, erscheint das gewünschte Schriftzeichen.

Beispiel: Hat man etwa in der Unicode-Tabelle für Amharisch das erste Zeichen in der zweiten Zeile, „hu“, gefunden, so liest man den dort angegebenen Code „1201“ ab. Anschließend schreibt man „U+1201“ und drückt hinterher simultan „Alt“ und „C“ (US-amerikanisch „Alt“ und „X“).  Läßt man die Tasten los, erscheint das Schriftzeichen ሁ.

Die Methode funktioniert in beide Richtungen; man kann also durch nochmaliges gleichzeitiges Drücken von „Alt“ und „C“ vom Schriftzeichen wieder zum Zeichencode zurückwechseln.

Anmerkung: Das „U+“ dient (bei 16 und 32 Bit-Kodierungen) als Anzeige, in welcher Reihenfolge (engl. „byte-order mark (BOM)“) die Bytes verschlüsselt sind. Bei Anwendungen, die auf UTF-8 basieren, kann man es zumeist weglassen, da es dort ohnehin nur eine mögliche Reihenfolge gibt. Nähere Informationen dazu finden sich in Unicode 11.0.0, S. 40-41.

„By convention, Unicode codepoints are represented in hexadecimal notation with a minimum of four digits and preceded with “U+”; so, for example, “U+0345”, “U+10345” and “U+20345”. Also by convention, any leading zeroes above four digits are suppressed; thus we would write “U+0456  CYRILLIC SMALL LETTER BYELORUSSIAN-UKRAINIAN I” but not “U+03456  !!unknown USV!!”.”

(Constable, SIL 2001)

Die Eingabemethode „Alt“+„C“ funktioniert vor allem unter Windows, aber auch in einigen anderen Anwendungen. So ist sie zum Beispiel ab Version 5.1. in LibreOffice anwendbar. Für Linux und Mac gibt es jeweils andere Eingabemöglichkeiten.

In älteren Word-Versionen wurde früher statt „Alt“+„C“ die ältere Variante „Alt“+„X“ benutzt. Diese Variante funktioniert jedoch in den deutschen Versionen ab Word 7 nicht mehr. Manchmal wird diese Form der Eingabe allerdings weiterhin in Dialogfeldern angewandt. Die US-amerikanischen Anwendungen dagegen haben überwiegend die Eingabevariante „Alt“+„X“ beibehalten.

Tipp: Man sollte sich immer darüber informieren, ob man gerade mit einer deutschen oder anderen, zum Beispiel US-amerikanischen Tastaturbelegung arbeitet, denn beide können jeweils unterschiedliche Schriftzeichen hervorbringen: „Beispielsweise produziert die auf einer deutschen Tastatur mit „z“ beschriftete Taste mit einer deutschen Tastenbelegung den Unicode-Codepoint U+007A, also (erwartungsgemäß) ein „z“. Ändert man die Tastenbelegung auf US-amerikanisch, so erzeugt dieselbe Taste den Codepoint U+0079, also ein „y“.“ (wiki.selfhtml.org)

Hilfe bei der Umrechnung (Dez-Hex)

Für die Umrechnung von binären in dezimale und hexadezimale Werte gibt es im Internet diverse Umrechnungshelfer, sei es von dezimal zu binär, von hexadezimal zu binär, oder umgekehrt von binär zu dezimal oder binär zu hexadezimal. Manche Konverter geben zusätzlich auch die Rechenwege bei der Umrechnung hexadezimaler in dezimale, oder binärer in dezimale Werte an oder zeigen die zugehörigen Bit-Stellen nach Wunsch in 8, 16 oder 32 Bit-Darstellung an.

Einige Konverter bieten auch Hilfe bei der Kodierung und Dekodierung speziell für Unicode-Zeichen an. Hier kann man beispielsweise ein Unicode-Schriftzeichen, das man in einem Dokument oder im Internet gefunden hat, per „copy and paste“ in ein Online-Formular eingeben, auf „konvertieren“ drücken und erhält dann die zugehörigen (zum Beispiel dezimalen) Unicode-Werte zu diesem Zeichen.

Tipp: In manchen Unicode-Umwandlungstools werden sowohl die dezimalen als auch die hexadezimalen Werte für solcherart eingefügte Zeichen angegeben (Beispiel: „Get the Unicode and UTF-8 for a character“). Wenn man dagegen den hexadezimalen Wert kennt, kann man diesen eingeben, und erhält dann dazu den dezimalen Wert sowie eine grafische Darstellung des Zeichens, jedenfalls soweit das durch den Internet-Browser unterstützt wird (Beispiel: „Convert Unicode code point to UTF-8“).

Hier geht es weiter zum Beitrag Unicode – Schriftzeichen (Teil 6).

Facebook
Twitter
LinkedIn
Email
Print