Caracteres árabes en Unicode
A partir de Unicode 10.0, los siguientes rangos codifican caracteres árabes:
- Árabe (0600-06FF)
- Suplemento árabe (0750-077F)
- Árabe extendido-A (08A0-08FF)
- Formas de presentación árabe-A (FB50-FDFF)
- Formas de presentación árabe-B (FE70-FEFF)
- Símbolos alfabéticos matemáticos árabes (1EE00-1EEFF)
- Símbolos numéricos rumanos (10E60-10E7F)
La gama básica árabe codifica las letras y los diacríticos estándar, pero no codifica las formas contextuales (U+0621-U+0652 se basan directamente en ISO 8859-6); y también incluye los diacríticos más comunes y los dígitos arábigos. La gama del Suplemento Árabe codifica las variantes de las letras que se utilizan principalmente para escribir las lenguas africanas (no árabes). La gama Arabic Extended-A codifica anotaciones coránicas adicionales y variantes de letras utilizadas para diversas lenguas no árabes. La gama Arabic Presentation Forms-A codifica formas contextuales y ligaduras de variantes de letras necesarias para el persa, el urdu, el sindhi y las lenguas de Asia Central. La gama de formas de presentación del árabe-B codifica las formas de espaciado de los diacríticos árabes y otras formas de letras contextuales. Las formas de presentación están presentes sólo por compatibilidad con normas más antiguas, y actualmente no son necesarias para codificar texto. El bloque de símbolos alfabéticos árabes codifica los caracteres utilizados en las expresiones matemáticas árabes.
Vea aquí la tabla de códigos oficial del Consorcio Unicode