Arabische tekens in Unicode
Zoals in Unicode 10.0 coderen de volgende reeksen Arabische tekens:
- Arabisch (0600-06FF)
- Arabisch supplement (0750-077F)
- Arabisch uitgebreid-A (08A0-08FF)
- Arabische presentatievormen-A (FB50-FDFF)
- Arabische presentatievormen-A (FB50-FDFF)
- Arabische presentatievormen-B (FE70-FEFF)
- Arabische wiskundige alfabetische symbolen (1EE00-1EEFF)
- Rumi-numerieke symbolen (10E60-10E7F)
De Arabische basisreeks codeert de standaardletters en diakritische tekens, maar codeert geen contextuele vormen (U+0621-U+0652 zijn rechtstreeks gebaseerd op ISO 8859-6); en bevat ook de meest voorkomende diakritische tekens en Arabisch-Indische cijfers. De Arabisch supplement-reeks codeert lettervarianten die meestal gebruikt worden voor het schrijven van Afrikaanse (niet-Arabische) talen. De reeks Arabisch Uitgebreid-A codeert extra Koran-annotaties en lettervarianten die voor diverse niet-Arabische talen worden gebruikt. De reeks Arabische presentatievormen-A codeert contextuele vormen en ligaturen van lettervarianten die nodig zijn voor Perzisch, Urdu, Sindhi en Centraal-Aziatische talen. De reeks Arabische presentatievormen-B codeert afstandsvormen van Arabische diakritische tekens, en meer contextuele lettervormen. De presentatievormen zijn alleen aanwezig voor compatibiliteit met oudere standaarden, en zijn momenteel niet nodig voor het coderen van tekst. Het blok Arabische wiskundige alfabetische symbolen codeert tekens die worden gebruikt in Arabische wiskundige uitdrukkingen.
Zie hier de officiële codetabel van het Unicode Consortium