Caratteri arabi in Unicode
A partire da Unicode 10.0, i seguenti intervalli codificano i caratteri arabi:
- Arabo (0600-06FF)
- Supplemento arabo (0750-077F)
- Arabo esteso-A (08A0-08FF)
- Forme di presentazione arabo-A (FB50-FDFF)
- Forme di presentazione arabo-B (FE70-FEFF)
- Simboli alfabetici matematici arabi (1EE00-1EEFF)
- Simboli numerali Rumi (10E60-10E7F)
La gamma araba di base codifica le lettere standard e i diacritici, ma non codifica le forme contestuali (U+0621-U+0652 sono direttamente basati su ISO 8859-6); e include anche i diacritici più comuni e le cifre arabo-indiche. La gamma Arabic Supplement codifica varianti di lettere usate principalmente per scrivere lingue africane (non arabe). La gamma Arabic Extended-A codifica annotazioni coraniche aggiuntive e varianti di lettere usate per varie lingue non arabe. La gamma Arabic Presentation Forms-A codifica forme contestuali e legature di varianti di lettere necessarie per il persiano, l’urdu, il sindhi e le lingue dell’Asia centrale. La gamma Arabic Presentation Forms-B codifica forme di spaziatura dei diacritici arabi e forme di lettere più contestuali. Le forme di presentazione sono presenti solo per compatibilità con i vecchi standard, e non sono attualmente necessarie per la codifica del testo. Il blocco Arabic Mathematical Alphabetical Symbols codifica i caratteri usati nelle espressioni matematiche arabe.
Vedi qui la tabella ufficiale dei codici del Consorzio Unicode