En reconnaissance des formes et en apprentissage automatique, un vecteur de caractéristiques est un vecteur à n dimensions de caractéristiques numériques qui représentent un certain objet. De nombreux algorithmes d’apprentissage automatique nécessitent une représentation numérique des objets, car ces représentations facilitent le traitement et l’analyse statistique. Lors de la représentation d’images, les valeurs des caractéristiques peuvent correspondre aux pixels d’une image, tandis que lors de la représentation de textes, les caractéristiques peuvent être les fréquences d’occurrence de termes textuels. Les vecteurs de caractéristiques sont équivalents aux vecteurs de variables explicatives utilisés dans les procédures statistiques telles que la régression linéaire. Les vecteurs de caractéristiques sont souvent combinés avec des poids en utilisant un produit scalaire afin de construire une fonction prédicteur linéaire qui est utilisée pour déterminer un score pour faire une prédiction.
L’espace vectoriel associé à ces vecteurs est souvent appelé espace de caractéristiques. Afin de réduire la dimensionnalité de l’espace des caractéristiques, un certain nombre de techniques de réduction de la dimensionnalité peuvent être employées.
Des caractéristiques de plus haut niveau peuvent être obtenues à partir de caractéristiques déjà disponibles et ajoutées au vecteur de caractéristiques ; par exemple, pour l’étude des maladies, la caractéristique « Âge » est utile et est définie comme Âge = « Année de décès » moins « Année de naissance » . Ce processus est appelé « construction de caractéristiques ». La construction de caractéristiques est l’application d’un ensemble d’opérateurs constructifs à un ensemble de caractéristiques existantes, aboutissant à la construction de nouvelles caractéristiques. Parmi les exemples de tels opérateurs constructifs, on peut citer la vérification des conditions d’égalité {=, ≠}, les opérateurs arithmétiques {+,-,×, /}, les opérateurs de tableau {max(S), min(S), average(S)} ainsi que d’autres opérateurs plus sophistiqués, par exemple count(S,C) qui compte le nombre de caractéristiques dans le vecteur de caractéristiques S satisfaisant une certaine condition C ou, par exemple, les distances à d’autres classes de reconnaissance généralisées par un certain dispositif d’acceptation. La construction de caractéristiques est depuis longtemps considérée comme un outil puissant pour augmenter à la fois la précision et la compréhension de la structure, en particulier dans les problèmes à haute dimension. Les applications comprennent des études sur les maladies et la reconnaissance des émotions à partir de la parole.