Quando se trata de conjuntos de valores colunares, existem três tipos de cardinalidade: cardinalidade alta, cardinalidade normal e cardinalidade baixa.
A cardinalidade alta refere-se a colunas com valores que são muito pouco comuns ou únicos. Os valores das colunas de alta-cartualidade são normalmente números de identificação, endereços de e-mail ou nomes de usuários. Um exemplo de uma coluna de tabela de dados com alta cardinalidade seria uma tabela de USUÁRIOS com uma coluna chamada USUÁRIO_ID. Essa coluna conteria valores únicos de 1-n. Cada vez que um novo usuário é criado na tabela USERS, um novo número seria criado na coluna USER_ID para identificá-los de forma única. Como os valores mantidos na coluna USER_ID são únicos, o tipo de cardinalidade desta coluna seria referido como high-cardinality.
Normal-cardinality refere-se a colunas com valores que são um pouco incomuns. Os valores de cardinalidade normal das colunas são normalmente nomes, endereços de rua ou tipos de veículos. Um exemplo de uma coluna de tabela de dados com cardinalidade normal seria uma tabela de CLIENTE com uma coluna chamada LAST_NAME, contendo os sobrenomes dos clientes. Enquanto algumas pessoas têm sobrenomes comuns, tais como Smith, outras têm sobrenomes incomuns. Portanto, um exame de todos os valores mantidos na coluna LAST_NAME mostraria “tufos” de nomes em alguns lugares (por exemplo, muitos ferreiros) rodeados em ambos os lados por uma longa série de valores únicos. Como há uma variedade de valores possíveis nesta coluna, seu tipo de cardinalidade seria referido como cardinalidade normal.
Baixa cardinalidade refere-se a colunas com poucos valores únicos. Valores de colunas com baixa cardinalidade são tipicamente bandeiras de status, valores booleanos ou classificações principais, como sexo. Um exemplo de uma coluna de tabela de dados com baixa cardinalidade seria uma tabela CLIENTE com uma coluna chamada NEW_CUSTOMER. Essa coluna conteria apenas dois valores distintos: S ou N, denotando se o cliente era novo ou não. Como existem apenas dois valores possíveis nesta coluna, seu tipo de cardinalidade seria chamado de baixa cardinalidade.