Caracteres árabes em Unicode
As de Unicode 10.0, os seguintes intervalos codificam caracteres arábicos:
- Arabic (0600-06FF)
- Arabic Supplement (0750-077F)
- Arabic Extended-A (08A0-08FF)
- Arabic Presentation Forms-A (FB50-FDFF)
- Arabic Presentation Forms-B (FE70-FEFF)
- Símbolos Matemáticos Alfabéticos Árabes (1EE00-1EEFF)
- Símbolos Numerais Rumi (10E60-10E7F)
A gama básica árabe codifica as letras padrão e diacríticos, mas não codifica formas contextuais (U+0621-U+0652 sendo diretamente baseado na ISO 8859-6); e também inclui os diacríticos mais comuns e os dígitos arábico-índicos. O Suplemento Árabe codifica as variantes de letras mais usadas para escrever línguas africanas (não árabes). O Suplemento Arábico-Extensivo codifica anotações adicionais de Alcorão e variantes de letras usadas para várias línguas não árabes. Os Formulários de Apresentação em Árabe – A gama de formatos codifica formas contextuais e ligaduras de variantes de letras necessárias para os idiomas Persa, Urdu, Sindhi e Ásia Central. Os Formulários de Apresentação em Árabe-B codificam formas de espaçamento de diacríticos arábicos, e formas de letras mais contextuais. Os formulários de apresentação estão presentes apenas para compatibilidade com padrões mais antigos, e não são actualmente necessários para codificar texto. O bloco Arábico-matemático Símbolos Alfabéticos codifica caracteres usados em expressões matemáticas arábicas.
Veja aqui a tabela de códigos oficial do Unicode Consortium