|
Animation interactive |
Inertie (d'un nuage de points)
L'origine du concept d'inertie se trouve dans la Mécanique. De même que la masse est la mesure de la résistance d'un corps à changer son mouvement de translation sous l'effet d'une force, le moment d'inertie d'un corps est la mesure de sa résistance à changer son mouvement de rotation autour d'un point O sous l'effet d'un couple.
Le moment d'inertie M d'un point P par rapport à O est :
MO = m.d²
où :
* m est la masse du point, et
* d est la distance entre O et P.
Si un corps est une assemblée rigide de points discrets, son moment d'inertie par rapport à O est la somme des moments d'inertie de ses points (par rapport à O). Si le corps est rigide, mais continu, la défiintion est est la même, avec "somme" remplacée par "intégrale", et "masse" par "densité".
La densité n'est pas normalisée (intégrale égale à 1) comme
c'est le cas pour une densité de probabilité.
----------
Les propriétés essentielles du moment d'inertie sont :
MO = Mx + My
Ce point est illustré dans l'animation interactive
sur la Matrice de Covariance (
),
et est une application directe du Théorème de Pythagore. Il se généralise immédiatement
au cas à p dimensions, p > 2.
MO = MG + MOG
ou, en mots : "Le moment d'inertie par rapport à O est la somme de deux termes :
* Le moment d'inertie par rapport au centre de gravité G, et
* Le moment d'inertie par rapport à O d'un point fictif situé en G et de masse M.
______________________________
Tout ceci ressemble plus à un cours de Mécanique qu'à de la Modélisation de Données. Mais cette dernière discipline rencontre souvent des "nuages de points", le terme "point" voulant dire alors "observation décrite par des attributs numériques".
Ces points peuvent avoir des masses différentes pour différentes raisons :
* Plusieurs observations peuvent avoir exactement les mêmes valeurs de leurs attributs.
* Plusieurs observations très semblables ont été artificiellement regroupées dans une observation unique dont le "poids" est le nombre d'observations qui ont été ainsi regroupées (classification non supervisée).
* Certaines observations sont arbitrairement affectées de "poids" reflétant leur importance aux yeux de l'analyste.
En Analyse des Correspondances, les "points" sont des modalités de variables nominales, et le "poids" d'une modalité est le nombre d'observations paratageant cette modalité.
Ainsi, le concept d'Inertie d'un nuage de points ("Moment d' " étant habituellement ignoré en Modélisation de Données) apparaît naturellement dans de nombreuses techniques comme :
En Modélisation de Données, le terme "masse"
est remplacé par le terme (impropre) de "poids".
_____________
Il est important de remarquer que l'Inertie n'est pas une propriété géométrique d'un nuage comme peut l'être, par exemple, sa variance dans une direction donnée, et ceci pour deux raisons :
* Les points sont affectés de poids. Pour une répartition géométrique donnée des points, la valeur de l'inertie dépend des valeurs des poids.
* Une propriété géométrique,
comme la position du centre de gravité ou bien la variance dans une direction
donnée, ne doit (presque) pas changer si des points sont ajoutés au nuage,
tout en respectant la répartition globale des points (voir animation sur la
Matrice de Covariance
).
Ainsi, la position du centre de gravité est une moyenne effectuée sur un
ensemble de points, et change peu quand des points sont ajoutés en respectant
la répartition globale des points.
Mais l'inertie n'est pas une moyenne,
c'est une quantité cumulative : elle augmente systématiquement quand on
ajoute des points au nuage..
Une authentique (bien que sommaire) description de la géométrie du nuage est fournie par sa Matrice de Covariance, et plus particulièrement sa Matrice de Covariance Diagonalisée.
Quand les poids peuvent être ignorés (c.à.d. quand ils sont tous égaux à 1), il existe néanmoins un lien entre Inertie et Matrice de Covariance : l'Inertie est alors égale à n fois la somme des éléments diagonaux de la Matrice de Covariance (où n est la nombre de points du nuage). Pour plus de détails, voir Matrice de Covariance.
Dans le cas de l'Analyse des Correspondances, il n'est pas possible de modifier les poids, et le concept de Matrice de Covariance n'a pas de sens.
____________________________________________________________
Voir aussi :
|