Arabische Zeichen in Unicode
Ab Unicode 10.0 kodieren die folgenden Bereiche arabische Zeichen:
- Arabisch (0600-06FF)
- Arabic Supplement (0750-077F)
- Arabic Extended-A (08A0-08FF)
- Arabic Presentation Forms-A (FB50-FDFF)
- Arabic Presentation Forms-B (FE70-FEFF)
- Arabische mathematische Alphabetsymbole (1EE00-1EEFF)
- Rumi-Zahlensymbole (10E60-10E7F)
Der arabische Grundbereich kodiert die Standardbuchstaben und diakritischen Zeichen, kodiert aber keine kontextuellen Formen (U+0621-U+0652 basieren direkt auf ISO 8859-6); und umfasst auch die gängigsten diakritischen Zeichen und arabisch-indischen Ziffern. Der Bereich Arabic Supplement kodiert Buchstabenvarianten, die hauptsächlich für afrikanische (nicht-arabische) Sprachen verwendet werden. Der Bereich Arabic Extended-A kodiert zusätzliche Korananmerkungen und Buchstabenvarianten, die für verschiedene nicht-arabische Sprachen verwendet werden. Die Reihe Arabic Presentation Forms-A kodiert kontextbezogene Formen und Ligaturen von Buchstabenvarianten, die für Persisch, Urdu, Sindhi und zentralasiatische Sprachen benötigt werden. Der Bereich Arabic Presentation Forms-B kodiert Abstandsformen von arabischen Diakritika und weitere kontextbezogene Buchstabenformen. Die Darstellungsformen sind nur aus Gründen der Kompatibilität mit älteren Standards vorhanden und werden derzeit nicht für die Codierung von Text benötigt. Der Block Arabic Mathematical Alphabetical Symbols kodiert Zeichen, die in arabischen mathematischen Ausdrücken verwendet werden.
Siehe hier die offizielle Codetabelle des Unicode-Konsortiums