Métrique

Règle, ou formule, qui définit la façon dont doit être calculée la distance entre deux individus.
 

Beaucoup de techniques de modélisation se servent de la "distance" entre deux individus. Ainsi :

    * La Classification Ascendante Hiérarchique commence par regrouper les deux individus dont la distance est la plus petite parmi toutes les paires de points (c'est à dire, en fait, les deux individus les plus semblables).
       * L'Analyse en Composantes Principales (ACP) projette les individus sur un plan choisi de façon à minimiser les distorsions des distances entre individus occasionnées par la projection.

 

Supposons que toutes les variables soient numériques (éventuellement après codage des variables nominales). Comment définir la "distance" entre deux individus ? Le premier réflexe est d'avoir recours à la classique et rassurante distance euclidienne. Mais pourquoi elle, alors qu'il en existe quantité d'autres ? En fait, la distance euclidienne n'est pas toujours une  bonne mesure de la similarité (ou plutôt, de la dissimilarité) entre individus quand il s'agit de construire un modèle des données.

 

Il n'est pas possible d'entrer plus dans les détails dans ce Glossaire, mais vous verrez souvent mentionnées :

    * La distance de Mahalanobis entre un individu et le centre d'une distribution (multi)normale.

    * La distance du Khi-2 entre lignes d'une Analyse des Correspondances.

 

________________________________________________

 

Téléchargez ce Glossaire