Cuando se trata de conjuntos de valores de columnas, hay tres tipos de cardinalidad: alta cardinalidad, normal-cardinalidad y baja cardinalidad.
La alta cardinalidad se refiere a las columnas con valores que son muy poco comunes o únicos. Los valores de columna de alta cardinalidad suelen ser números de identificación, direcciones de correo electrónico o nombres de usuario. Un ejemplo de una columna de tabla de datos con alta cardinalidad sería una tabla USERS con una columna llamada USER_ID. Esta columna contendría valores únicos de 1-n. Cada vez que se crea un nuevo usuario en la tabla USERS, se crearía un nuevo número en la columna USER_ID para identificarlo de forma única. Dado que los valores contenidos en la columna USER_ID son únicos, el tipo de cardinalidad de esta columna se denominaría de alta cardinalidad.
La cardinalidad normal se refiere a columnas con valores que son algo poco comunes. Los valores de las columnas de cardinalidad normal suelen ser nombres, direcciones de calles o tipos de vehículos. Un ejemplo de una columna de tabla de datos con cardinalidad normal sería una tabla CLIENTES con una columna llamada APELLIDOS, que contiene los apellidos de los clientes. Mientras que algunas personas tienen apellidos comunes, como Smith, otras tienen apellidos poco comunes. Por lo tanto, un examen de todos los valores contenidos en la columna LAST_NAME mostraría «grupos» de nombres en algunos lugares (por ejemplo, muchos Smiths) rodeados a ambos lados por una larga serie de valores únicos. Dado que hay una variedad de valores posibles en esta columna, su tipo de cardinalidad se denominaría cardinalidad normal.
La cardinalidad baja se refiere a columnas con pocos valores únicos. Los valores de las columnas de baja cardinalidad suelen ser indicadores de estado, valores booleanos o clasificaciones importantes como el género. Un ejemplo de una columna de tabla de datos con baja cardinalidad sería una tabla CLIENTE con una columna llamada NUEVO_CLIENTE. Esta columna contendría sólo dos valores distintos: S o N, que indican si el cliente es nuevo o no. Como sólo hay dos valores posibles en esta columna, su tipo de cardinalidad se denominaría de baja cardinalidad.