Indischer Skriptcode für den Informationsaustausch - Indian Script Code for Information Interchange
Indian Script Code for Information Interchange ( ISCII ) ist ein Kodierungsschema zur Darstellung verschiedener Schriftsysteme Indiens . Es kodiert die wichtigsten indischen Schriften und eine römische Transliteration. Die unterstützten Skripte sind: Assamesisch , Bengali (Bangla) , Devanagari , Gujarati , Gurmukhi , Kannada , Malayalam , Oriya , Tamil und Telugu . ISCII kodiert nicht die Schriftsysteme Indiens, die auf Persisch basieren , aber seine Schriftsystem-Umschaltcodes sehen dennoch Kaschmir , Sindhi , Urdu , Persisch , Paschtu und Arabisch vor . Die auf Persisch basierenden Schriftsysteme wurden anschließend in der PASCII- Kodierung kodiert.
ISCII wurde außerhalb bestimmter Regierungsinstitutionen nicht weit verbreitet verwendet, obwohl eine Variante ohne den ATR- Mechanismus auf dem klassischen Mac OS verwendet wurde und die jetzt von Unicode weitgehend veraltet ist . Unicode verwendet einen separaten Block für jedes indische Schreibsystem und behält das ISCII-Layout innerhalb jedes Blocks weitgehend bei.
Hintergrund
Die von Brahmi abgeleiteten Schriftsysteme haben eine ähnliche Struktur. ISCII codiert also Buchstaben mit demselben phonetischen Wert am selben Codepunkt und überlagert die verschiedenen Skripte. Beispielsweise repräsentieren die ISCII-Codes 0xB3 0xDB [ki]. Dies wird als കി in Malayalam , कि in Devanagari, als ਕਿ in Gurmukhi und als கி in Tamil wiedergegeben. Das Schriftsystem kann im Rich Text per Markup oder im Klartext über den unten beschriebenen ATR- Code ausgewählt werden.
Eine Motivation für die Verwendung einer einzigen Kodierung ist die Idee, dass sie eine einfache Transliteration von einem Schriftsystem in ein anderes ermöglicht. Es gibt jedoch genug Inkompatibilitäten, dass dies nicht wirklich eine praktische Idee ist.
ISCII ist eine 8-Bit-Codierung. Die unteren 128 Codepunkte sind reines ASCII , die oberen 128 Codepunkte sind ISCII-spezifisch. Zusätzlich zu den Codepunkten, die Zeichen darstellen, verwendet ISCII einen Codepunkt mit mnemonischer ATR , der angibt, dass das folgende Byte eine von zwei Arten von Informationen enthält. Ein Satz von Werten ändert das Schriftsystem bis zum nächsten Schriftsystemindikator oder Zeilenende. Ein weiterer Satz von Werten wählt Anzeigemodi wie fett und kursiv aus. ISCII bietet keine Möglichkeit, das Standardschriftsystem anzugeben.
Codepage-Layout
Die folgende Tabelle zeigt den Zeichensatz für Devanagari . Die Codesätze für Assamesisch, Bengali, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil und Telugu sind ähnlich, wobei jede Devanagari- Form in jedem Schriftsystem durch die entsprechende Form ersetzt wird . Jedes Zeichen wird mit seinem Dezimalcode und seinem Unicode- Äquivalent angezeigt .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
ein 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
i 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
ँ 0901 |
ं 0902 |
ः 0903 |
अ 0905 |
आ 0906 |
इ 0907 |
ई 0908 |
उ 0909 |
ऊ 090A |
ऋ 090B |
ऎ 090E |
ए 090F |
ऐ 0910 |
ऍ 090D |
ऒ 0912 |
|
B_ 176 |
ओ 0913 |
औ 0914 |
ऑ 0911 |
क 0915 |
ख 0916 |
ग 0917 |
घ 0918 |
19 0919 |
च 091A |
1 091B |
ज 091C |
झ 091D |
ञ 091E |
ट 091F |
ठ 0920 |
ड 0921 |
C_ 192 |
ढ 0922 |
ण 0923 |
त 0924 |
थ 0925 |
द 0926 |
ध 0927 |
न 0928 |
ऩ 0929 |
प 092A |
2 092B |
ब 092C |
भ 092D |
म 092E |
2 092F |
य़ 095F |
र 0930 |
D_ 208 |
ऱ 0931 |
32 0932 |
ळ 0933 |
ऴ 0934 |
व 0935 |
श 0936 |
ष 0937 |
स 0938 |
ह 0939 |
INV |
ा 093E |
ि 093F |
ी 0940 |
ु 0941 |
ू 0942 |
ृ 0943 |
E_ 224 |
ॆ 0946 |
े 0947 |
ै 0948 |
ॅ 0945 |
ॊ 094A |
ो 094B |
ौ 094C |
ॉ 0949 |
् 094D |
़ 093C |
. 0964 |
ATR |
||||
F_ 240 |
EXT |
0 0966 |
1 0967 |
2 0968 |
3 0969 |
4 096A |
6 096B |
6 096C |
7 096D |
8 096E |
9 096F |
Brief Nummer Interpunktion Symbol Andere Nicht definiert
Spezielle Codepunkte
- INV-Zeichen – Codepunkt D9 (217)
- Das INV-Zeichen (unsichtbarer Konsonant) wird als Pseudokonsonant verwendet, um Kombinationselemente isoliert anzuzeigen. Zum Beispiel ist क (ka) + ् (Halogen) + INV = क् (halbes ka). Das Unicode-Äquivalent ist U+200D ZERO WIDTH JOINER ( ZWJ ). Wie unten erwähnt , kann der ISCII-Halant-Charakter jedoch verdoppelt oder mit dem ISCII-Nukta kombiniert werden, um Effekte zu erzielen, die von ZWNJ oder ZWJ in Unicode erzeugt werden. Aus diesem Grund ordnet Apple das ISCII-INV-Zeichen der Unicode -Markierung von links nach rechts zu, um Round-Tripping zu gewährleisten .
- ATR-Zeichen – Codepunkt EF (239)
- Das ATR-Zeichen (Attribut) gefolgt von einem Byte-Code wird verwendet, um bis zur nächsten ATR-Sequenz oder dem Ende des . zu einem anderen Schriftattribut ( zB fett) oder zu einer anderen ISCII- oder PASCII- Sprache ( zB Bengali) zu wechseln Linie. Dies hat kein direktes Unicode-Äquivalent, da Schriftartattribute nicht Teil von Unicode sind und jedes Skript einen eigenen Satz von Codepunkten hat.
ATR + Byte | Gedächtnisstütze | Formatierungsoption |
---|---|---|
0x30 | BLD | Fett gedruckt |
0x31 | ITA | Kursivschrift |
0x32 | UL | Unterstreichen |
0x33 | EXP | Erweitert |
0x34 | HLT | Markieren |
0x35 | OTL | Gliederung |
0x36 | SHD | Schatten |
0x37 | OBEN | Obere Hälfte des Zeichens (wird mit LOW verwendet, um Zeichen mit doppelter Höhe zu erstellen) |
0x38 | NIEDRIG | Untere Hälfte des Zeichens (wird mit TOP verwendet, um Zeichen mit doppelter Höhe zu erstellen) |
0x39 | DBL | Ganze Reihe doppelt breit und doppelt hoch |
ATR + Byte | Gedächtnisstütze | ISCII-Skript |
---|---|---|
0x40 | DEF | Standardskript (dh das Skript, auf das nach einem Zeilenumbruch zurückgeschaltet wird) |
0x41 | RMN | Romanisierte Transliteration |
0x42 | DEV | Devanagari |
0x43 | BNG | Bengalische Schrift |
0x44 | TML | Tamilisches Skript |
0x45 | TLG | Telugu-Skript |
0x46 | ASM | Assamesisches Skript |
0x47 | ORI | Odia-Skript |
0x48 | KND | Kannada-Skript |
0x49 | MLM | Malayalam-Skript |
0x4A | GJR | Gujarati-Skript |
0x4B | PNJ | Gurmukh |
ATR + Byte | Gedächtnisstütze | PASCII-Gebietsschema |
---|---|---|
0x71 | ARB | Arabisches Alphabet |
0x72 | SPE | Persisches Alphabet |
0x73 | URD | Urdu-Alphabet |
0x74 | SND | Sindhi Alphabet |
0x75 | KSM | Kaschmir-Alphabet |
0x76 | PST | Pashto-Alphabet |
- EXT-Zeichen – Codepunkt F0 (240)
- Das Zeichen EXT (Erweiterungen für Vedic) gefolgt von einem Byte-Code weist auf einen vedischen Akzent hin. Dies hat kein direktes Unicode-Äquivalent, da vedische Akzente verschiedenen Codepunkten zugewiesen werden.
- Halant-Zeichen ् – Codepunkt E8 (232)
- Das Halant-Zeichen entfernt den impliziten Vokal aus einem Konsonanten und wird zwischen Konsonanten verwendet, um konjunkte Konsonanten darzustellen. Zum Beispiel क (ka) + ् (halant) + त (ta) = क्त (kta). Die Folge ् (halant) + ् (halant) zeigt eine Konjunktion mit einem expliziten halant, zum Beispiel क (ka) + ् (halant) + ् (halant) + त (ta) = क्त. Die Folge ् (halant) + ़ (nukta) zeigt eine Konjunktion mit Halbkonsonanten, falls vorhanden, zum Beispiel क (ka) + ् (halant) + ़ (nukta) + त (ta) = क्त.
ISCII | Unicode | ||
---|---|---|---|
einzelne halant | E8 |
halant |
094D
|
halant + halant | E8 E8 |
halant + ZWNJ |
094D 200C
|
Halant + Nukta | E8 E9 |
halant + ZWJ |
094D 200D
|
- Nukta-Zeichen ़ – Codepunkt E9 (233)
- Das Nukta- Zeichen nach einem anderen ISCII-Zeichen wird für eine Reihe seltenerer Zeichen verwendet, die im Haupt-ISCII-Set nicht vorhanden sind. Zum Beispiel क (ka) + ़ (nukta) = क़ (qa). Diese Zeichen haben in Unicode vorgefertigte Formen, wie in der folgenden Tabelle gezeigt.
ISCII- Codepunkt |
Ursprünglicher Charakter |
Charakter mit Nukta |
Unicode- Codepunkt |
---|---|---|---|
A1 (161) | ँ | ॐ | 0950 |
A6 (166) | इ | ऌ | 090C |
A7 (167) | ई | ॡ | 0961 |
AA (176) | ऋ | ॠ | 0960 |
B3 (179) | क | क़ | 0958 |
B4 (180) | ख | ख़ | 0959 |
B5 (181) | ग | ग़ | 095A |
BA (186) | ज | ज़ | 095B |
BF (191) | ड | ड़ | 095C |
C0 (192) | ढ | ढ़ | 095D |
C9 (201) | फ | फ़ | 095E |
DB (219) | ि | ॢ | 0962 |
Gleichstrom (220) | ी | ॣ | 0963 |
DF (223) | ृ | ॄ | 0944 |
EA (234) | . | ऽ | 093D |
Codepages für die ISCII-Konvertierung
Um von Unicode (UTF-8) in eine ISCII / ANSI-Codierung zu konvertieren, können die folgenden Codepages verwendet werden:
- 57002: Devanagari (Hindi, Marathi, Sanskrit, Konkani)
- 57003: Bengalisch
- 57004: Tamil
- 57005: Telugu
- 57006: Assamesisch
- 57007: Odia
- 57008: Kannada
- 57009: Malayalam
- 57010: Gujarati
- 57011: Punjabi (Gurmukhi)
Codepunkte für alle Sprachen
Verhexen | Offizielle Auflistung |
ISO 15919 | Devanagari | Bengali | Assamesisch | Gurmukhi | Gujarati | Oriya | Tamil | Telugu | Kannada | Malayalam | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A0 | Zeichen OM Sign | ॐ | 0950 | ૐ | 0AD0 | |||||||||||||||||
A1 | Vokal-Modifikator CHANDRABINDU | ँ | 0901 | ঁ | 0981 | ঁ | 0981 | ਁ | 0A01 | ઁ | 0A81 | ଁ | 0B01 | ఁ | 0C01 | |||||||
A2 | Vokal-Modifikator ANUSWARAM | ṁ | ं | 0902 | ং | 0982 | ং | 0982 | ਂ | 0A02 | ં | 0A82 | ଂ | 0B02 | ஂ | 0B82 | ం | 0C02 | ಂ | 0C82 | ം | 0D02 |
A3 | Vokal-Modifikator VISARGAM | H | ः | 0903 | ঃ | 0983 | ঃ | 0983 | ਃ | 0A03 | ઃ | 0A83 | ଃ | 0B03 | ஃ | 0B83 | ః | 0C03 | ಃ | 0C83 | ഃ | 0D03 |
A4 | Vokal A | ein | अ | 0905 | অ | 0985 | অ | 0985 | ਅ | 0A05 | અ | 0A85 | ଅ | 0B05 | அ | 0B85 | అ | 0C05 | ಅ | 0C85 | അ | 0D05 |
A5 | Vokal AA | ein | आ | 0906 | আ | 0986 | আ | 0986 | ਆ | 0A06 | આ | 0A86 | ଆ | 0B06 | ஆ | 0B86 | ఆ | 0C06 | ಆ | 0C86 | ആ | 0D06 |
A6 | Vokal ich | ich | इ | 0907 | ই | 0987 | ই | 0987 | ਇ | 0A07 | ઇ | 0A87 | ଇ | 0B07 | இ | 0B87 | ఇ | 0C07 | ಇ | 0C87 | ഇ | 0D07 |
A6* | Vokal LI (Sanskrit) | L | ऌ | 090C | ঌ | 098C | ঌ | 098C | ઌ | 0A8C | ଌ | 0B0C | ఌ | 0C0C | ಌ | 0C8C | ഌ | 0D0C | ||||
A7 | Vokal II | ich | ई | 0908 | ঈ | 0988 | ঈ | 0988 | ਈ | 0A08 | ઈ | 0A88 | ଈ | 0B08 | ஈ | 0B88 | ఈ | 0C08 | ಈ | 0C88 | ഈ | 0D08 |
A7 * | Vokal LII (Sanskrit) | L | ॡ | 0961 | ৡ | 09E1 | ৡ | 09E1 | ૡ | 0AE1 | ୡ | 0B61 | ౡ | 0C61 | ೡ | 0CE1 | ൡ | 0D61 | ||||
A8 | Vokal U | u | उ | 0909 | উ | 0989 | উ | 0989 | ਉ | 0A09 | ઉ | 0A89 | ଉ | 0B09 | உ | 0B89 | ఉ | 0C09 | ಉ | 0C89 | ഉ | 0D09 |
A9 | Vokal UU | û | ऊ | 090A | ঊ | 098A | ঊ | 098A | ਊ | 0A0A | ઊ | 0A8A | ଊ | 0B0A | ஊ | 0B8A | ఊ | 0C0A | ಊ | 0C8A | ഊ | 0D0A |
AA | Vokal RI | r̥ | ऋ | 090B | ঋ | 098B | ঋ | 098B | ઋ | 0A8B | ଋ | 0B0B | ఋ | 0C0B | ಋ | 0C8B | ഋ | 0D0B | ||||
AA* | Vokal RII (Sanskrit) | r | ॠ | 0960 | ৠ | 09E0 | ৠ | 09E0 | ૠ | 0AE0 | ୠ | 0B60 | ౠ | 0C60 | ೠ | 0CE0 | ൠ | 0D60 | ||||
AB | Vokal E (südliche Schriften) | e | ऎ | 090E | எ | 0B8E | ఎ | 0C0E | ಎ | 0C8E | എ | 0D0E | ||||||||||
AC | Vokal EY | ē | ए | 090F | এ | 098F | এ | 098F | ਏ | 0A0F | એ | 0A8F | ଏ | 0B0F | ஏ | 0B8F | ఏ | 0C0F | ಏ | 0C8F | ഏ | 0D0F |
ANZEIGE | Vokal AI | ai | ऐ | 0910 | ঐ | 0990 | ঐ | 0990 | ਐ | 0A10 | ઐ | 0A90 | ଐ | 0B10 | ஐ | 0B90 | ఐ | 0C10 | ಐ | 0C90 | ഐ | 0D10 |
AE | Vokal AYE (Devanagari-Schrift) | ê | ऍ | 090D | ઍ | 0A8D | ||||||||||||||||
AF | Vokal O (Südliche Schriften) | Ö | ऒ | 0912 | ஒ | 0B92 | ఒ | 0C12 | ಒ | 0C92 | ഒ | 0D12 | ||||||||||
B0 | Vokal OW | Ö | ओ | 0913 | ও | 0993 | ও | 0993 | ਓ | 0A13 | ઓ | 0A93 | ଓ | 0B13 | ஓ | 0B93 | ఓ | 0C13 | ಓ | 0C93 | ഓ | 0D13 |
B1 | Vokal AU | au | औ | 0914 | ঔ | 0994 | ঔ | 0994 | ਔ | 0A14 | ઔ | 0A94 | ଔ | 0B14 | ஔ | 0B94 | ఔ | 0C14 | ಔ | 0C94 | ഔ | 0D14 |
B2 | Vokal AWE (Devanagari-Schrift) | Ö | ऑ | 0911 | ઑ | 0A91 | ||||||||||||||||
B3 | Konsonant KA | k | क | 0915 | ক | 0995 | ক | 0995 | ਕ | 0A15 | ક | 0A95 | କ | 0B15 | க | 0B95 | క | 0C15 | ಕ | 0C95 | ക | 0D15 |
B3* | Konsonanten-QA (Urdu) | q | क़ | 0958 | ||||||||||||||||||
B4 | Konsonant KHA | kh | ख | 0916 | খ | 0996 | খ | 0996 | ਖ | 0A16 | ખ | 0A96 | ଖ | 0B16 | ఖ | 0C16 | ಖ | 0C96 | ഖ | 0D16 | ||
B4* | Konsonant KHHA (Urdu) | kh | ख़ | 0959 | ਖ਼ | 0A59 | ||||||||||||||||
B5 | Konsonant GA | G | ग | 0917 | গ | 0997 | গ | 0997 | ਗ | 0A17 | ગ | 0A97 | ଗ | 0B17 | గ | 0C17 | ಗ | 0C97 | ഗ | 0D17 | ||
B5* | Konsonant GHHA (Urdu) | G | ग़ | 095A | ਗ਼ | 0A5A | ||||||||||||||||
B6 | Konsonant GHA | gh | घ | 0918 | ঘ | 0998 | ঘ | 0998 | ਘ | 0A18 | ઘ | 0A98 | ଘ | 0B18 | ఘ | 0C18 | ಘ | 0C98 | ഘ | 0D18 | ||
B7 | Konsonant NGA | ñ | ङ | 0919 | ঙ | 0999 | ঙ | 0999 | ਙ | 0A19 | ઙ | 0A99 | ଙ | 0B19 | ங | 0B99 | ఙ | 0C19 | ಙ | 0C99 | ങ | 0D19 |
B8 | Konsonant CHA | c | च | 091A | চ | 099A | চ | 099A | ਚ | 0A1A | ચ | 0A9A | ଚ | 0B1A | ச | 0B9A | చ | 0C1A | ಚ | 0C9A | ച | 0D1A |
B9 | Konsonant CHHA | CH | छ | 091B | ছ | 099B | ছ | 099B | ਛ | 0A1B | છ | 0A9B | ଛ | 0B1B | ఛ | 0C1B | ಛ | 0C9B | ഛ | 0D1B | ||
BA | Konsonant JA | j | ज | 091C | জ | 099C | জ | 099C | ਜ | 0A1C | જ | 0A9C | ଜ | 0B1C | ஜ | 0B9C | జ | 0C1C | ಜ | 0C9C | ജ | 0D1C |
BA* | Konsonant ZA (Urdu) | z | ज़ | 095B | ਜ਼ | 0A5B | ||||||||||||||||
BB | Konsonant JHA | jh | झ | 091D | ঝ | 099D | ঝ | 099D | ਝ | 0A1D | ઝ | 0A9D | ଝ | 0B1D | ఝ | 0C1D | ಝ | 0C9D | ഝ | 0D1D | ||
BC | Konsonant JNA | ñ | ञ | 091E | ঞ | 099E | ঞ | 099E | ਞ | 0A1E | ઞ | 0A9E | ଞ | 0B1E | ஞ | 0B9E | ఞ | 0C1E | ಞ | 0C9E | ഞ | 0D1E |
BD | Konsonant Hard TA | T | ट | 091F | ট | 099F | ট | 099F | ਟ | 0A1F | ટ | 0A9F | ଟ | 0B1F | ட | 0B9F | ట | 0C1F | ಟ | 0C9F | ട | 0D1F |
SEIN | Konsonant hart THA | ṭh | ठ | 0920 | ঠ | 09A0 | ঠ | 09A0 | ਠ | 0A20 | ઠ | 0AA0 | ଠ | 0B20 | ఠ | 0C20 | ಠ | 0CA0 | ഠ | 0D20 | ||
BF | Konsonant Hard DA | D | ड | 0921 | ড | 09A1 | ড | 09A1 | ਡ | 0A21 | ડ | 0AA1 | ଡ | 0B21 | డ | 0C21 | ಡ | 0CA1 | ഡ | 0D21 | ||
BF* | Konsonant Flapped DA | ṛ | ड़ | 095C | ড় | 09DC | ড় | 09DC | ੜ | 0A5C | ଡ଼ | 0B5C | ||||||||||
C0 | Konsonant Hard DHA | h | ढ | 0922 | ঢ | 09A2 | ঢ | 09A2 | ਢ | 0A22 | ઢ | 0AA2 | ଢ | 0B22 | ఢ | 0C22 | ಢ | 0CA2 | ഢ | 0D22 | ||
C0* | Konsonant Flapped DHA | h | ढ़ | 095D | ঢ় | 09DD | ঢ় | 09DD | ଢ଼ | 0B5D | ||||||||||||
C1 | Konsonant hart NA | ñ | ण | 0923 | ণ | 09A3 | ণ | 09A3 | ਣ | 0A23 | ણ | 0AA3 | ଣ | 0B23 | ண | 0BA3 | ణ | 0C23 | ಣ | 0CA3 | ണ | 0D23 |
C2 | Konsonant weich TA | t | त | 0924 | ত | 09A4 | ত | 09A4 | ਤ | 0A24 | ત | 0AA4 | ତ | 0B24 | த | 0BA4 | త | 0C24 | ತ | 0CA4 | ത | 0D24 |
C3 | Konsonant Weiches THA | das | थ | 0925 | থ | 09A5 | থ | 09A5 | ਥ | 0A25 | થ | 0AA5 | ଥ | 0B25 | థ | 0C25 | ಥ | 0CA5 | ഥ | 0D25 | ||
C4 | Konsonant Soft DA | d | द | 0926 | দ | 09A6 | দ | 09A6 | ਦ | 0A26 | દ | 0AA6 | ଦ | 0B26 | ద | 0C26 | ದ | 0CA6 | ദ | 0D26 | ||
C5 | Konsonant Soft DHA | dh | ध | 0927 | ধ | 09A7 | ধ | 09A7 | ਧ | 0A27 | ધ | 0AA7 | ଧ | 0B27 | ధ | 0C27 | ಧ | 0CA7 | ധ | 0D27 | ||
C6 | Konsonant weich NA | nein | न | 0928 | ন | 09A8 | ন | 09A8 | ਨ | 0A28 | ન | 0AA8 | ନ | 0B28 | ந | 0BA8 | న | 0C28 | ನ | 0CA8 | ന | 0D28 |
C7 | Konsonant NA (Tamil) | ñ | ऩ | 0929 | ன | 0BA9 | ||||||||||||||||
C8 | Konsonant PA | p | प | 092A | প | 09AA | প | 09AA | ਪ | 0A2A | પ | 0AAA | ପ | 0B2A | ப | 0BAA | ప | 0C2A | ಪ | 0CAA | പ | 0D2A |
C9 | Konsonant PHA | ph | फ | 092B | ফ | 09AB | ফ | 09AB | ਫ | 0A2B | ફ | 0AAB | ଫ | 0B2B | ఫ | 0C2B | ಫ | 0CAB | ഫ | 0D2B | ||
C9* | Konsonant FA (Urdu) | f | फ़ | 095E | ਫ਼ | 0A5E | ೞ | 0CDE | ||||||||||||||
CA | Konsonant BA | b | ब | 092C | ব | 09AC | ব | 09AC | ਬ | 0A2C | બ | 0AAC | ବ | 0B2C | బ | 0C2C | ಬ | 0CAC | ബ | 0D2C | ||
CB | Konsonant BHA | bh | भ | 092D | ভ | 09AD | ভ | 09AD | ਭ | 0A2D | ભ | 0AAD | ଭ | 0B2D | భ | 0C2D | ಭ | 0CAD | ഭ | 0D2D | ||
CC | Konsonant MA | ich | म | 092E | ম | 09AE | ম | 09AE | ਮ | 0A2E | મ | 0AAE | ମ | 0B2E | ம | 0BAE | మ | 0C2E | ಮ | 0CAE | മ | 0D2E |
CD | Konsonant YA | ja | य | 092F | য | 09AF | য | 09AF | ਯ | 0A2F | ય | 0AAF | ଯ | 0B2F | ய | 0BAF | య | 0C2F | ಯ | 0CAF | യ | 0D2F |
CE | Konsonant JYA (Bengalisch, Assamesisch & Oriya) | ẏ | य़ | 095F | য় | 09DF | য় | 09DF | ୟ | 0B5F | ||||||||||||
CF. | Konsonant RA | r̥ | र | 0930 | র | 09B0 | ৰ︎ | 09F0 | ਰ | 0A30 | ર | 0AB0 | ର | 0B30 | ர | 0BB0 | ర | 0C30 | ರ | 0CB0 | ര | 0D30 |
D0 | Konsonant Hard RA (Südliche Schriften) | ṟ | ऱ | 0931 | ற | 0BB1 | ఱ | 0C31 | ಱ | 0CB1 | റ | 0D31 | ||||||||||
D1 | Konsonant LA | l | ल | 0932 | ল | 09B2 | ল | 09B2 | ਲ | 0A32 | લ | 0AB2 | ଲ | 0B32 | ல | 0BB2 | ల | 0C32 | ಲ | 0CB2 | ല | 0D32 |
D2 | Konsonant Hard LA | L | ळ | 0933 | ਲ਼ | 0A33 | ળ | 0AB3 | ଳ | 0B33 | ள | 0BB3 | ళ | 0C33 | ಳ | 0CB3 | ള | 0D33 | ||||
D3 | Konsonant ZHA (Tamil & Malayalam) | L | ऴ | 0934 | ழ | 0BB4 | ഴ | 0D34 | ||||||||||||||
D4 | Konsonant VA | v | व | 0935 | ব | 09AC | ৱ | 09F1 | ਵ | 0A35 | વ | 0AB5 | ଵ | 0B35 | வ | 0BB5 | వ | 0C35 | ವ | 0CB5 | വ | 0D35 |
D5 | Konsonant SHA | ś | श | 0936 | শ | 09B6 | শ | 09B6 | ਸ਼ | 0A36 | શ | 0AB6 | ଶ | 0B36 | ஶ | 0BB6 | శ | 0C36 | ಶ | 0CB6 | ശ | 0D36 |
D6 | Konsonant Hard SHA | s | ष | 0937 | ষ | 09B7 | ষ | 09B7 | ષ | 0AB7 | ଷ | 0B37 | ஷ | 0BB7 | ష | 0C37 | ಷ | 0CB7 | ഷ | 0D37 | ||
D7 | Konsonant SA | so | स | 0938 | স | 09B8 | স | 09B8 | ਸ | 0A38 | સ | 0AB8 | ସ | 0B38 | ஸ | 0BB8 | స | 0C38 | ಸ | 0CB8 | സ | 0D38 |
D8 | Konsonant HA | ha | ह | 0939 | হ | 09B9 | হ | 09B9 | ਹ | 0A39 | હ | 0AB9 | ହ | 0B39 | ஹ | 0BB9 | హ | 0C39 | ಹ | 0CB9 | ഹ | 0D39 |
D9 | Konsonant UNSICHTBAR | |||||||||||||||||||||
DA | Vokalzeichen AA | ein | ा | 093E | া | 09BE | া | 09BE | ਾ | 0A3E | ા | 0ABE | ା | 0B3E | ா | 0BBE | ా | 0C3E | ಾ | 0CBE | ാ | 0D3E |
DB | Vokalzeichen I | ich | ि | 093F | ি | 09BF | ি | 09BF | ਿ | 0A3F | િ | 0ABF | ି | 0B3F | ி | 0BBF | ి | 0C3F | ಿ | 0CBF | ി | 0D3F |
DB* | Vokalzeichen LI (Sanskrit) | L | ॢ | 0962 | ৢ | 09E2 | ৢ | 09E2 | ૢ | 0AE2 | ୢ | 0B62 | ౢ | 0C62 | ೢ | 0CE2 | ൢ | 0D62 | ||||
DC | Vokalzeichen II | ich | ी | 0940 | ী | 09C0 | ী | 09C0 | ੀ | 0A40 | ી | 0AC0 | ୀ | 0B40 | ீ | 0BC0 | ీ | 0C40 | ೀ | 0CC0 | ീ | 0D40 |
Gleichstrom* | Vokalzeichen LII (Sanskrit) | L | ॣ | 0963 | ৣ | 09E3 | ৣ | 09E3 | ૣ | 0AE3 | ୣ | 0B63 | ౣ | 0C63 | ೣ | 0CE3 | ൣ | 0D63 | ||||
DD | Vokalzeichen U | u | ु | 0941 | ু | 09C1 | ু | 09C1 | ੁ | 0A41 | ુ | 0AC1 | ୁ | 0B41 | ு | 0BC1 | ు | 0C41 | ು | 0CC1 | ു | 0D41 |
DE | Vokalzeichen UU | û | ू | 0942 | ূ | 09C2 | ূ | 09C2 | ੂ | 0A42 | ૂ | 0AC2 | ୂ | 0B42 | ூ | 0BC2 | ూ | 0C42 | ೂ | 0CC2 | ൂ | 0D42 |
DF | Vokalzeichen RI | r̥ | ृ | 0943 | ৃ | 09C3 | ৃ | 09C3 | ૃ | 0AC3 | ୃ | 0B43 | ృ | 0C43 | ೃ | 0CC3 | ൃ | 0D43 | ||||
DF * | Vokalzeichen RII (Sanskrit) | r | ॄ | 0944 | ৄ | 09C4 | ৄ | 09C4 | ૄ | 0AC4 | ୄ | 0B44 | ౄ | 0C44 | ೄ | 0CC4 | ൄ | 0D44 | ||||
E0 | Vokalzeichen E (südliche Schriften) | e | ॆ | 0946 | ெ | 0BC6 | ె | 0C46 | ೆ | 0CC6 | െ | 0D46 | ||||||||||
E1 | Vokalzeichen EY | ē | े | 0947 | ে | 09C7 | ে | 09C7 | ੇ | 0A47 | ે | 0AC7 | େ | 0B47 | ே | 0BC7 | ే | 0C47 | ೇ | 0CC7 | േ | 0D47 |
E2 | Vokalzeichen AI | ai | ै | 0948 | ৈ | 09C8 | ৈ | 09C8 | ੈ | 0A48 | ૈ | 0AC8 | ୈ | 0B48 | ை | 0BC8 | ై | 0C48 | ೈ | 0CC8 | ൈ | 0D48 |
E3 | Vokalzeichen AYE (Devanagari-Schrift) | ê | ॅ | 0945 | ૅ | 0AC5 | ||||||||||||||||
E4 | Vokalzeichen O (Südliche Schriften) | Ö | ॊ | 094A | ொ | 0BCA | ొ | 0C4A | ೊ | 0CCA | ൊ | 0D4A | ||||||||||
E5 | Vokalzeichen OW | Ö | ो | 094B | ো | 09CB | ো | 09CB | ੋ | 0A4B | ો | 0ACB | ୋ | 0B4B | ோ | 0BCB | ో | 0C4B | ೋ | 0CCB | ോ | 0D4B |
E6 | Vokalzeichen AU | au | ौ | 094C | ৌ | 09CC | ৌ | 09CC | ੌ | 0A4C | ૌ | 0ACC | ୌ | 0B4C | ௌ | 0BCC | ౌ | 0C4C | ೌ | 0CCC | ൌ | 0D4C |
E7 | Vokalzeichen AWE (Devanagari-Schrift) | Ö | ॉ | 0949 | ૉ | 0AC9 | ||||||||||||||||
E8 | Vokal-Auslassungszeichen (Halant) | ् | 094D | ্ | 09CD | ্ | 09CD | ੍ | 0A4D | ્ | 0ACD | ୍ | 0B4D | ் | 0BCD | ్ | 0C4D | ್ | 0CCD | ് | 0D4D | |
E9 | Diakritisches Zeichen (Nuktam) | ़ | 093C | ় | 09BC | ় | 09BC | ਼ | 0A3C | ઼ | 0ABC | ଼ | 0B3C | ಼ | 0CBC | |||||||
EA | Punkt (Viram, Northern Scripts) | . | 0964 | |||||||||||||||||||
EA* | Vokal-Stress-Zeichen AVAGRAH | ऽ | 093D | ঽ | 09BD | ঽ | 09BD | ઽ | 0ABD | ଽ | 0B3D | ఽ | 0C3D | ಽ | 0CBD | ഽ | 0D3D | |||||
EB | Ungebraucht | |||||||||||||||||||||
EC | Ungebraucht | |||||||||||||||||||||
ED | Ungebraucht | |||||||||||||||||||||
EE | Ungebraucht | |||||||||||||||||||||
EF | Attributcode | |||||||||||||||||||||
F0 | Erweiterungscode | |||||||||||||||||||||
F1 | Ziffer 0 | ० | 0966 | 0 | 09E6 | 0 | 09E6 | 0 | 0A66 | 0 | 0AE6 | ୦ | 0B66 | 0 | 0BE6 | 0 | 0C66 | 0 | 0CE6 | 0 | 0D66 | |
F2 | Ziffer 1 | 1 | 0967 | 1 | 09E7 | 1 | 09E7 | 1 | 0A67 | 1 | 0AE7 | ୧ | 0B67 | 1 | 0BE7 | 1 | 0C67 | 1 | 0CE7 | 1 | 0D67 | |
F3 | Ziffer 2 | 2 | 0968 | ২ | 09E8 | ২ | 09E8 | 2 | 0A68 | 2 | 0AE8 | ୨ | 0B68 | 2 | 0BE8 | 2 | 0C68 | 2 | 0CE8 | 2 | 0D68 | |
F4 | Ziffer 3 | ३ | 0969 | 3 | 09E9 | 3 | 09E9 | ੩ | 0A69 | 3 | 0AE9 | ୩ | 0B69 | 3 | 0BE9 | 3 | 0C69 | 3 | 0CE9 | 3 | 0D69 | |
F5 | Ziffer 4 | 4 | 096A | 4 | 09EA | 4 | 09EA | 4 | 0A6A | 4 | 0AEA | ୪ | 0B6A | 4 | 0BEA | 4 | 0C6A | 4 | 0CEA | 4 | 0D6A | |
F6 | Stelle 5 | ५ | 096B | 5 | 09EB | ৫ | 09EB | 5 | 0A6B | 5 | 0AEB | ୫ | 0B6B | 5 | 0BEB | ౫ | 0C6B | 5 | 0CEB | 5 | 0D6B | |
F7 | Ziffer 6 | 6 | 096C | ৬ | 09EC | 6 | 09EC | 6 | 0A6C | 6 | 0AEC | ୬ | 0B6C | 6 | 0BEC | 6 | 0C6C | 6 | 0CEC | 6 | 0D6C | |
F8 | Ziffer 7 | 7 | 096D | 7 | 09ED | ৭ | 09ED | 7 | 0A6D | 7 | 0AED | ୭ | 0B6D | 7 | 0BETT | 7 | 0C6D | 7 | 0CED | 7 | 0D6D | |
F9 | Ziffer 8 | 8 | 096E | ৮ | 09EE | 8 | 09EE | 8 | 0A6E | 8 | 0AEE | ୮ | 0B6E | ௮ | 0BEE | 8 | 0C6E | 8 | 0CEE | ൮ | 0D6E | |
FA | Ziffer 9 | 9 | 096F | 9 | 09EF | 9 | 09EF | 9 | 0A6F | 9 | 0AEF | ୯ | 0B6F | 9 | 0BEF | 9 | 0C6F | 9 | 0CEF | 9 | 0D6F | |
FB | Ungebraucht | |||||||||||||||||||||
FC | Ungebraucht | |||||||||||||||||||||
FD | Ungebraucht | |||||||||||||||||||||
FE | Ungebraucht | |||||||||||||||||||||
FF | Ungebraucht |