Unicode – Schriftzeichen (Teil 2)

Fremdsprachige Dokumente zu erstellen und zu bearbeiten, gehört zu den Aufgaben vieler Wissenschaftler*innen. Praktisch ist es da, wenn man die Texte auch gleich im Original eingeben und die entsprechenden Schriftzeichen dazu nutzen kann. Die Zeichencodes des Unicode-Standards bieten dazu die Möglichkeit. Wo aber finden beispielsweise Afrikawissenschaftler*innen die entsprechenden Codes für die Schriftzeichen, die sie benutzen wollen?

Afrikanische Schriftzeichen im dezimalen Zeichencode

Afrikanische Sprachen, die auf dem lateinischen Schriftsystem beruhen, können in der Regel mit Zeichen aus einem der Blöcke der lateinischen Schriften geschrieben werden, die sich in Unicode (bis auf „Latin Extended Additional“, mit den Dezimalpositionen 7680-7935) fast alle auf den vorderen Dezimalpositionen 32-879 befinden.

Die Pennstate-Universität (2016) hat zudem einige afrikanische Sprachen aufgelistet, für deren digitalisierte Schreibung bereits Vorlagen bestehen. So werden beispielsweise für Fula, Hausa, Igbo und Wolof spezifische Unicode-Dezimalcodes angegeben (und auch alternative Lösungen für Mac-Nutzer angesprochen), die als sogenannte „Alt codes“ für die Tastatureingabe unter Windows genutzt werden können:

Unicode (decimal) for African languages, personal.psu.edu (Pennstate University 2016). CC: AN 2018, BY-NC-SA

Für Computer-Eingaben weiterer Schriftsysteme kann man in den verschiedenen Unicode-Zeichentabellen nach den entsprechenden Zeichen suchen. Eine nach Blöcken von verschiedenen Schriftsystemen geordnete Unicode-Tabelle (2005) mit einer umfassenden Anzahl von Dezimalcodes für verschiedene Sprachen bzw. deren Schriftsysteme stellt zum Beispiel die Universität Wisconsin-Madison zur Verfügung. Die Tabelle umfasst einen Großteil der 2005 bekannten 97.655 Unicode Zeichen weltweit (von derzeit 137.374 Zeichen, Stand Unicode Version 11.0.0 von 2018):


Unicode (decimal), ssec.wisc.edu (University of Wisonsin-Madison 2015). CC: AN 2018, BY-NC-SA.

Eine 2012 erstellte Unicodezeichen-Tabelle (mit Updates von 2015 bis 2017) des St. Petersburger Webstudios „Sa•design“ erlaubt es darüber hinaus, durch das Gesamtrepertoire der Unicode-Zeichen zu browsen. Geht man in diesem Programm mit dem Cursor der Maus auf einen gewünschten Buchstaben, öffnet sich darunter ein kleines Feld, in dem rechts neben der hexadezimalen Angabe („U+“) auch die dezimale Angabe („Dec:“, gefolgt vom numerischen Dezimalcode) verzeichnet ist. Das Repertoire der Zeichenkode-Tabelle enthält alle Unicode Zeichen bis einschließlich der Unicode Version 10.0.0 von 2017. Man kann auch nach Blöcken geordnet gezielt nach bestimmten Schriftsystemen suchen:


Unicode (decimal), unicode-table.com (Sa•design 2017). CC: AN 2018, BY-NC-SA.

Die frei herunterladbare Software „BabelMap“ ermöglicht es ebenfalls, durch das gesamte Unicodezeichen-Repertoire zu browsen, und die zugehörigen Unicode-Kodierungen aufzufinden: Beim Browsen wird rechts unten zum jeweiligen markierten Schriftzeichen hinter dem Begriff „Decimal“ jeweils der zugehörige Unicode Dezimalcode angezeigt. BabelMap in der Version 11.0.0.1 von 2018 gibt in seiner Beschreibung an, dass die Daten der neuesten Unicode Version 11.0.0 von 2018 bereits darin eingearbeitet sind:


Unicode (decimal) in BabelMap Version 11.0.0.1, 2018. CC: AN 2018, BY-NC-SA.

Alternativ dazu kann man auch das Online-Tool „BabelMap Online (Unicode 11.0)“ verwenden.

Unicode Lookup“ (2009) stellt ein weiteres nützliches Tool zur Suche dar, vor allem da man gezielt Suchkodierungen eingeben kann. Für die dezimalen Kodierungen muss man in der zweiten Spalte unter „Dec“ nachschauen. Die Schriftzeichen der neueren Unicode Versionen, wie Adlam von 2016 oder Bamum von 2009, enthält es jedoch noch nicht:


Unicode (decimal) in Unicode Lookup 2009, unicodelookup.com. CC: AN 2018, BY-NC-SA.

Wer seinen Schriftzeichen auch die phonetische Umschreibung über das Internationale Phonetische Alphabet (IPA) hinzufügen will, kann auch diese Zeichen über Unicode eingeben. Die dezimalen Codes für das IPA findet man beispielsweise auf der Webseite von InternationalPhoneticAlphabet.org (2017). Der entsprechende Code findet sich jeweils hinter dem Symbol, in der zweiten Spalte der Tabelle:


Unicode (decimal) for International Phonetic Alphabet (IPA), InternationalPhoneticAlphabet.org 2017. CC: AN 2018, BY-NC-SA.

Die dezimalen Codes werden jeweils anschließend über die sogenannten „Windows Alt Codes“ in den Computer eingegeben, um die gewünschten Schriftzeichen digital darzustellen.

Kommentare sind deaktiviert