Arab karakterek a Unicode-ban
Az Unicode 10-től.0 óta a következő tartományok kódolják az arab karaktereket:
- Arabic (0600-06FF)
- Arabic Supplement (0750-077F)
- Arabic Extended-A (08A0-08FF)
- Arabic Presentation Forms-A (FB50-FDFF)
- Arabic Presentation Forms-B (FE70-FEFF)
- Arabic Mathematical Alphabetic Symbols (1EE00-1EEFF)
- Rumi Numeral Symbols (10E60-10E7F)
Az arab alaptartomány a standard betűket és diakritikus jeleket kódolja, de nem kódolja a kontextuális formákat (az U+0621-U+0652 közvetlenül az ISO 8859-6-on alapul); és tartalmazza a leggyakoribb diakritikus jeleket és az arab-indikus számjegyeket is. Az Arabic Supplement tartomány a főként afrikai (nem arab) nyelvek írásához használt betűváltozatokat kódolja. Az Arabic Extended-A tartomány a Korán kiegészítő megjegyzéseit és a különböző nem arab nyelveknél használt betűváltozatokat kódolja. Az Arabic Presentation Forms-A tartomány a perzsa, urdu, szindhi és közép-ázsiai nyelvekhez szükséges betűváltozatok kontextuális formáit és ligatúráit kódolja. Az Arabic Presentation Forms-B tartomány az arab diakritikus betűk távolsági formáit és több kontextuális betűformát kódol. A prezentációs formák csak a régebbi szabványokkal való kompatibilitás miatt vannak jelen, és jelenleg nem szükségesek a szöveg kódolásához. Az Arabic Mathematical Alphabetical Symbols blokk az arab matematikai kifejezésekben használt karaktereket kódolja.
Lásd itt a Hivatalos Unicode Konzorcium kódtáblázatát
.