Beim Umgang mit Spaltenwertsätzen gibt es drei Arten von Kardinalität: hohe Kardinalität, normale Kardinalität und niedrige Kardinalität.
Hohe Kardinalität bezieht sich auf Spalten mit Werten, die sehr ungewöhnlich oder einzigartig sind. Spaltenwerte mit hoher Kardinalität sind typischerweise Identifikationsnummern, E-Mail-Adressen oder Benutzernamen. Ein Beispiel für eine Datentabellenspalte mit hoher Kardinalität wäre eine Tabelle USERS mit einer Spalte namens USER_ID. Diese Spalte würde eindeutige Werte von 1-n enthalten. Jedes Mal, wenn ein neuer Benutzer in der Tabelle USERS angelegt wird, wird eine neue Nummer in der Spalte USER_ID erstellt, um ihn eindeutig zu identifizieren. Da die Werte in der Spalte USER_ID eindeutig sind, wird der Kardinalitätstyp dieser Spalte als hohe Kardinalität bezeichnet.
Normale Kardinalität bezieht sich auf Spalten mit Werten, die eher selten sind. Spaltenwerte mit normaler Kardinalität sind typischerweise Namen, Straßenadressen oder Fahrzeugtypen. Ein Beispiel für eine Datentabellenspalte mit normaler Kardinalität wäre eine Tabelle CUSTOMER mit einer Spalte namens LAST_NAME, die die Nachnamen der Kunden enthält. Während einige Personen häufige Nachnamen haben, wie z. B. Smith, haben andere ungewöhnliche Nachnamen. Daher würde eine Untersuchung aller Werte in der Spalte LAST_NAME an einigen Stellen „Klumpen“ von Namen zeigen (z. B. eine Menge Smiths), die auf beiden Seiten von einer langen Reihe eindeutiger Werte umgeben sind. Da diese Spalte eine Vielzahl möglicher Werte enthält, würde ihr Kardinalitätstyp als normale Kardinalität bezeichnet werden.
Niedrige Kardinalität bezieht sich auf Spalten mit wenigen eindeutigen Werten. Spaltenwerte mit geringer Kardinalität sind in der Regel Statuskennzeichen, boolesche Werte oder wichtige Klassifikationen wie das Geschlecht. Ein Beispiel für eine Datentabellenspalte mit geringer Kardinalität wäre eine Tabelle CUSTOMER mit einer Spalte namens NEW_CUSTOMER. Diese Spalte würde nur zwei unterschiedliche Werte enthalten: Y oder N, die angeben, ob der Kunde neu ist oder nicht. Da diese Spalte nur zwei mögliche Werte enthält, würde ihr Kardinalitätstyp als niedrige Kardinalität bezeichnet werden.