Unicodeにおけるアラビア文字
As of Unicode 10.0では、以下の範囲がアラビア文字をエンコードしています。
- Arabic (0600-06FF)
- Arabic Supplement (0750-077F)
- Arabic Extended-A (08A0-08FF)
- Arabic Presentation Forms-A (FB50-FDFF)
- Arabic Presentation Forms- (08FF)
- Arabic Mathematical Alphabetic Symbols (1EE00-1EEFF)
- Rumi Numeral Symbols (10E60-10E7F)
アラビア語表示形式-(FB50-FF) Arabic Extended-A (08FF)アラビック・プリベンション・フォームズ-(FB50-FF)B (FE70-FEFF)
基本アラビア範囲は標準文字とダイアクリティックスを符号化します。 U+0621-U+0652はISO 8859-6に直接基づいています)。 また、最も一般的な発音区分とアラビア数字-インド数字も含まれています。 アラビア語の補足範囲では、主にアフリカの(非アラビア語の)言語を書くために使用される文字の変種をエンコードします。 Arabic Extended-A range は、さまざまな非アラブ系言語で使用される追加のクルアーン注釈および文字のバリエーションをコード化します。 Arabic Presentation Forms-A range は、ペルシャ語、ウルドゥー語、シンドゥー語、中央アジアの言語で必要とされる文脈的な形式と合字の文字バリエーションをエンコードしています。 アラビア語表示形式-Bは、アラビア語の発音区分符号の間隔を示す形式と、より文脈的な文字形式を符号化したものです。 この表示形式は、古い標準との互換性のためにのみ存在し、現在ではテキストのコーディングには必要ありません。 Arabic Mathematical Alphabetical Symbols ブロックは、アラビア語の数学的表現で使われる文字をエンコードします
See here the Official Unicode Consortium code chart