Wanneer u te maken hebt met kolomsgewijze waardesets, zijn er drie soorten cardinaliteit: hoge-cardinaliteit, normale-cardinaliteit en lage-cardinaliteit.
Hoge-cardinaliteit heeft betrekking op kolommen met waarden die zeer ongebruikelijk of uniek zijn. Kolomwaarden met hoge kardinaliteit zijn meestal identificatienummers, e-mailadressen of gebruikersnamen. Een voorbeeld van een kolom in een gegevenstabel met hoge kardinaliteit is een tabel USERS met een kolom USER_ID. Deze kolom zou unieke waarden van 1-n bevatten. Telkens wanneer in de tabel USERS een nieuwe gebruiker wordt gecreëerd, zou in de kolom USER_ID een nieuw nummer worden gecreëerd om hem uniek te identificeren. Aangezien de waarden in de kolom USER_ID uniek zijn, zou het cardinaliteitstype van deze kolom high-cardinality worden genoemd.
Normal-cardinality verwijst naar kolommen met waarden die enigszins ongewoon zijn. Kolommen met een normale kardinaliteit zijn meestal namen, adressen of voertuigtypen. Een voorbeeld van een kolom in een gegevenstabel met normale-cardinaliteit is een tabel KLANT met een kolom LAST_NAME, die de achternamen van klanten bevat. Terwijl sommige mensen gewone achternamen hebben, zoals Smith, hebben anderen ongewone achternamen. Daarom zou een onderzoek van alle waarden in de kolom LAST_NAME op sommige plaatsen “klonters” namen te zien geven (b.v. veel Smiths), aan weerszijden omgeven door een lange reeks unieke waarden. Aangezien deze kolom een groot aantal mogelijke waarden bevat, zou het cardinaliteitstype normal-cardinality worden genoemd.
Low-cardinality verwijst naar kolommen met weinig unieke waarden. Kolomwaarden met lage kardinaliteit zijn meestal statusvlaggen, Booleaanse waarden of belangrijke classificaties zoals geslacht. Een voorbeeld van een kolom in een gegevenstabel met lage kardinaliteit is een KLANTentabel met een kolom met de naam NEW_CUSTOMER. Deze kolom zou slechts twee verschillende waarden bevatten: J of N, om aan te geven of de klant nieuw was of niet. Aangezien deze kolom slechts twee mogelijke waarden bevat, wordt het kardinaliteitstype ervan aangeduid als lage kardinaliteit
.