ANIMATION INTERACTIVE: MATRICE DE COVARIANCE

 

Cette animation illustre le concept de Matrice de Covariance.

 

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

 

Cadre supérieur


Beaucoup de techniques de modélisation reposent uniquement sur les moyennes et les matrices de coavariance (la plus connue étant l'Analyse Discriminante). On lit alors souvent "La distribution est supposée être multinormale". Ce que cette phrase veut dire est en fait "La technique décrite ci-dessous ne prend en compte que les moments du premier et du second ordre de la ou des distribution(s), à l'exclusion des moments d'ordres supérieurs".

 

Cadre inférieur

            Les axes verts (x', y') du cadre supérieur ont subi une rotation qui les amène dans les positions horizontale et verticale familières. Le nuage de points et l'ellipse ont subi la même rotation. Les axes de l'ellipse sont maintenant respectivement horizontal et vertical, mais l'ellipse a exactement la même forme et la même taille que l'ellipse du cadre supérieur.

Rappelons que x' est la direction d'élongation maximale du nuage. Celui-ci semble donc être étiré horizontalement (mais sa forme est en fait identique à celle du nuage du cadre supérieur).

De même, y' est la direction d'élongation minimale. Le nuage inférieur semble être "écrasé" dans la direction y'.

Matrice de Covariance

            A droite du cadre supérieur est la Matrice de Covariance du nuage de points.

Elements diagonaux

                    Ce sont les variances des projections du nuage respectivement sur l'axe horizontal x et l'axe vertical y.

Elements non diagonaux

                    Ils sont égaux (la matrice est dit "symétrique"), et leur valeur commune est Cov(x, y) = Cov(y, x).

 

Matrice de Covariance diagonalisée

                A la droite du cadre inférieur est la "Matrice de Covariance diagonalisée". C'est la Matrice de Covariance du nuage du cadre inférieur.

Elements diagonaux

                    Ce sont les variances des projections du nuage respectivement sur l'axe horizontal x' et l'axe vertical y'.

                        * La première valeur est la plus grande variance observable d'une projection du nuage sur un axe. Remarquez que cette valeur est supérieure aux variances lues dans la Matrice de Covariance. Dans le vocabulaire de l'Algèbre Linéaire (et de l'ACP), cette valeur est la Première Valeur Propre de la Matrice de Covariance initiale.

La longueur du demi grand-axe de l'ellipse est égale à la racine carrée de cette Première Valeur Propre. Elle est représentée par un segment orange horizontal.

                        * La seconde valeur est la plus petite variance observable d'une projection du nuage sur un axe. Remarquez que cette valeur est inférieure aux variances dans la Matrice de Covariance. Cette valeur est la Seconde Valeur Propre de la Matrice de Covariance initiale.  

La longueur du demi petit-axe de l'ellipse est égale à la racine carrée de cette seconde valeur propre. Elle est représentée par un segment orange vertical.

                        * La somme des deux variances de la Matrice de Covariance est égale (aux erreurs d'arrondi près) à la somme des variances de la Matrice de Covariance diagonalisée. Ceci est d'une part un théorème d'Algèbre Linéaire (la "trace" d'une matrice carrée est invariante dans un changement de repère orthonormé). D'autre part, cette somme reçoit en ACP une interprétation indépendante de tout système de référence.

Elements non diagonaux

                    Les deux éléments non diagonaux sont nuls (et en particulier, la matrice est donc symétrique). Ceci s'interprète de la façon suivante "x' et y' ont une covariance nulle, et sont donc décorrélées". Ceci peut se démontrer, mais est intuitif : en se déplaçant le long de l'axe x', la quantité y' ne montre aucune tendance systématique à l'augmentation ou à la diminution. La mise en évidence d'une telle tendance est la raison d'être de la covariance, et donc "absence de tendance" conduit naturellement à "covariance nulle".

Animation

            Dans le cadre supérieur, déplacez les points rouges avec votre souris, et observez les changements :

 

Dans le "cas général", le nuage de points a une forme quelque peu allongée qui fait des angles non nuls avec x et y.


Un mot à propos des axes verts. Leurs directions sont définies sans ambiguïté, mais leur orientations sont arbitraires. Cette animation a choisi des orientations telles que :
   * Les valeurs croissantes de x' vont toujours vers la droite.
   * Les valeurs croissantes de y' vont toujours vers le haut.

Ceci provoque des changements brutaux d'orientation des axes quand ceux-ci passent par la position verticale (x') ou horizontal (y'), avec une discontinuité dans la représentation du nuage de points dans le cadre inférieur.

__________________


Autres animations :

Inertie

Distribution normale bivariée

 

Téléchargez ce Glossaire