列の値セットを扱う場合、カーディナリティには、高カーディナリティ、通常カーディナリティ、および低カーディナリティの 3 種類があります。 高基準の列の値は、通常、識別番号、電子メール アドレス、またはユーザー名です。 高基数性を持つデータ・テーブル列の例としては、USER_ID という名前の列を持つ USERS テーブルがあります。 このカラムは1-nの一意な値を含む。 USERSテーブルに新しいユーザーが作成されるたびに、USER_IDカラムに新しい番号が作成され、ユーザーを一意に識別できるようになります。 USER_ID列に保持される値は一意であるため、この列の基数型は高基数型と呼ばれる。
通常基数型は、やや珍しい値を持つ列を指す。 通常のカラムの値は、通常、名前、住所、または車両タイプです。 データテーブルの列の例としては、CUSTOMERテーブルにLAST_NAMEという列があり、顧客の姓が格納されています。 Smithのような一般的な姓を持つ人もいれば、一般的でない姓を持つ人もいます。 したがって、LAST_NAME列に格納されているすべての値を調べると、ある場所には名前の「かたまり」があり(たとえば多くのSmith)、その両側には長い一意の値が並んでいることがわかります。 この列にはさまざまな値が格納されているため、そのカーディナリティ タイプは normal-cardinality と呼ばれます。
low-cardinality は、一意の値がほとんどない列を指します。 低基準の列の値は、通常、ステータス・フラグ、ブール値、または性別のような主要な分類です。 低基数性を持つデータテーブル列の例としては、NEW_CUSTOMERという列を持つCUSTOMERテーブルが挙げられます。 このカラムは2つの異なる値のみを含みます。 この列は、顧客が新規かそうでないかを示す、YまたはNの2つの異なる値のみを含みます。 この列には2つの値しかないので、カーディナリティのタイプは低カーディナリティと呼ばれます
。