Caractères arabes dans Unicode
A compter d’Unicode 10.0, les plages suivantes codent les caractères arabes :
- Arabe (0600-06FF)
- Supplément arabe (0750-077F)
- Arabe étendu-A (08A0-08FF)
- Formes de présentation arabe-A (FB50-FDFF)
- Formes de présentation arabe-.B (FE70-FEFF)
- Symboles alphabétiques mathématiques arabes (1EE00-1EEFF)
- Symboles numériques Rumi (10E60-10E7F)
La gamme arabe de base encode les lettres standard et les diacritiques, mais ne code pas les formes contextuelles (U+0621-U+0652 étant directement basés sur ISO 8859-6) ; et comprend également les diacritiques et les chiffres arabo-indiens les plus courants. La gamme Arabic Supplement code des variantes de lettres principalement utilisées pour l’écriture des langues africaines (non arabes). La gamme arabe étendue A code des annotations coraniques supplémentaires et des variantes de lettres utilisées pour diverses langues non arabes. La gamme Arabic Presentation Forms-A encode des formes contextuelles et des ligatures de variantes de lettres nécessaires pour le persan, l’ourdou, le sindhi et les langues d’Asie centrale. La gamme Arabic Presentation Forms-B encode les formes d’espacement des diacritiques arabes et des formes de lettres plus contextuelles. Les formes de présentation ne sont présentes que pour des raisons de compatibilité avec les anciennes normes et ne sont pas actuellement nécessaires pour coder du texte. Le bloc Symboles alphabétiques mathématiques arabes code les caractères utilisés dans les expressions mathématiques arabes.
Voir ici le tableau de codes officiel du Consortium Unicode
.