Lorsque l’on traite des ensembles de valeurs en colonnes, il existe trois types de cardinalité : cardinalité élevée, cardinalité normale et cardinalité faible.
La cardinalité élevée fait référence aux colonnes dont les valeurs sont très peu communes ou uniques. Les valeurs de colonnes à cardinalité élevée sont généralement des numéros d’identification, des adresses électroniques ou des noms d’utilisateur. Un exemple de colonne de table de données à cardinalité élevée serait une table USERS avec une colonne nommée USER_ID. Cette colonne contiendrait des valeurs uniques de 1-n. Chaque fois qu’un nouvel utilisateur est créé dans la table USERS, un nouveau numéro est créé dans la colonne USER_ID pour l’identifier de manière unique. Comme les valeurs détenues dans la colonne USER_ID sont uniques, le type de cardinalité de cette colonne serait qualifié de cardinalité élevée.
La cardinalité normale fait référence à des colonnes dont les valeurs sont quelque peu rares. Les valeurs de colonnes à cardinalité normale sont généralement des noms, des adresses de rue ou des types de véhicules. Un exemple de colonne de table de données à cardinalité normale serait une table CUSTOMER avec une colonne nommée LAST_NAME, contenant les noms de famille des clients. Si certaines personnes ont des noms de famille communs, tels que Smith, d’autres ont des noms de famille peu communs. Par conséquent, un examen de toutes les valeurs contenues dans la colonne NOM_FAMILLE ferait apparaître des « groupes » de noms à certains endroits (par exemple, beaucoup de Smith), entourés de part et d’autre d’une longue série de valeurs uniques. Comme il existe une variété de valeurs possibles détenues dans cette colonne, son type de cardinalité serait qualifié de cardinalité normale.
La cardinalité faible fait référence à des colonnes ayant peu de valeurs uniques. Les valeurs de colonnes à faible cardinalité sont généralement des indicateurs d’état, des valeurs booléennes ou des classifications majeures telles que le sexe. Un exemple de colonne de table de données à faible cardinalité serait une table CUSTOMER avec une colonne nommée NEW_CUSTOMER. Cette colonne ne contient que deux valeurs distinctes : Y ou N, indiquant si le client est nouveau ou non. Comme il n’y a que deux valeurs possibles détenues dans cette colonne, son type de cardinalité serait qualifié de faible cardinalité.