Arabiske tegn i Unicode
Som i Unicode 10.0 koder følgende intervaller for arabiske tegn:
- Arabisk (0600-06FF)
- Arabisk supplement (0750-077F)
- Arabisk udvidet-A (08A0-08FF)
- Arabiske præsentationsformer-A (FB50-FDFF)
- Arabiske præsentationsformer-B (FE70-FEFF)
- Arabiske matematiske alfabetiske symboler (1EE00-1EEFF)
- Rumi talsymboler (10E60-10E7F)
Den grundlæggende arabiske serie koder standardbogstaver og diakritiske tegn, men koder ikke kontekstuelle former (U+0621-U+0652 er direkte baseret på ISO 8859-6); og omfatter også de mest almindelige diakritiske tegn og arabisk-indiske cifre. Den arabiske tillægsserie koder bogstavvarianter, der hovedsagelig anvendes til at skrive afrikanske (ikke-arabiske) sprog. Den arabiske Extended-A-række koder for yderligere koraniske annotationer og bogstavvarianter, der anvendes til forskellige ikke-arabiske sprog. Arabic Presentation Forms-A-serien koder kontekstuelle former og ligaturer af bogstavvarianter, der er nødvendige for persisk, urdu, sindhi og centralasiatiske sprog. Arabic Presentation Forms-B-serien koder for afstandsformer af arabiske diakritiske bogstaver og mere kontekstuelle bogstavformer. Præsentationsformerne er kun til stede af hensyn til kompatibilitet med ældre standarder og er i øjeblikket ikke nødvendige til kodning af tekst. Blokken Arabic Mathematical Alphabetical Symbols (arabiske matematiske alfabetiske symboler) koder tegn, der anvendes i arabiske matematiske udtryk.
Se her det officielle kodediagram fra Unicode Consortium