|
Animation interactive |
Covariance
Comme son nom l'indique, la Covariance est une mesure de la force du lien entre deux variables aléatoires (numériques).
Soient X1 et X2 deux telles variables. Deux situations extrêmes peuvent se rencontrer :
X2 = f(X1)
Alors, connaître la valeur prise par X1 permet de connaître sans aucune incertitude la valeur prise par X2.
Dans les situations réalistes, le lien entre X1 et X2 est le plus souvent "entre les deux" : la connaissance de la valeur prise par X1 réduit, dans une certaine mesure, l'incertitude pesant sur la valeur que va prendre X2.
Il n'existe pas de grandeur universelle permettant la mesure de la force de ce lien dans les situations intermédiaires. La Covariance est une grandeur qui, malgré ses limitations, est très utile en pratique.
Si X1 et X2 sont fortement liées par un lien positif, on pourrait penser définir la Covariance en développant l'idée suivante :
* Quand X1 prend une valeur positive, alors X2 prend vraisemblablement aussi une valeur positive.
* Quand X1 prend une valeur négative alors X2 prend vraisemblablement aussi une valeur négative.
Cette idée ne convient pas, car nous voulons que la Covariance reste inchangée quand les distributions de probabilité des variables sont translatées par des quantités arbitraires. Au lieu de mesurer X1 et X2 à partir de 0, nous allons donc les mesurer à partir de références qui se translatent en même temps que les distributions, par exemple leurs moyennes µ1 et µ2. Notre idée originale devient maintenant :
* Quand (X1 - µ1) prend une valeur positive, alors (X2 - µ2 ) prend vraisemblablement aussi une valeur positive.
* Quand (X1 - µ1) prend une valeur négative alors (X2 - µ2 ) prend vraisemblablement aussi une valeur négative.
Ainsi, si X1 et X2 sont fortement (positivement) liées, les quantités (X1 - µ1) et (X2 - µ2 ) seront le plus souvent :
* Simultanément positives, ou
* Simultanément négatives.
Le produit (X1 - µ1).(X2 - µ2 ) sera donc alors le plus souvent positif :
* Soit parce que les deux quantités sont positives,
* Soit parce que les deux quantités sont négatives.
Le produit (X1 - µ1).(X2 - µ2) est une variable aléatoire, et nous voulons un nombre fixe. Mais une variable qui passe le plus clair de son temps à prendre des valeurs positives a vraisemblablement une espérance positive. Nous considérerons donc l'espérance du produit (X1 - µ1).(X2 - µ2), que nous appellerons Covariance de X1 et X2.
|
Cov(X1, X2 ) = E[(X1 - µ1).(X2 - µ2 )] |
Nous montrerons que cette expression est équivalente à celle ci :
|
Cov(X, Y) = E[XY] - E[X].E[Y] |
souvent plus commode à utiliser en pratique.
Poursuivant avec des arguments purement qualitatifs, notons que pour deux variables aléatoires X1 et X2 :
* Une valeur fortement positive de la Covariance est une indication que (X1 - µ1) et (X2 - µ2 ) prennent souvent des grandes valeurs positives ou de grandes valeurs négatives simultanément, un argument en faveur d'un lien (positif) fort entre les variables.
* Alors qu'une de la Covariance proche de 0 montre qu'une des variables sera vraisemblablement proche de sa moyenne quand l'autre prendra des valeurs élevées (positives ou négatives).
Donc une valeur positive importante de la Covariance est un bon détecteur d'un lien fort entre deux v.a.. On montre alors que ce lien est alors nécessairement linéaire.
A l'inverse, quelle conclusion peut-on tirer d'une valeur de la Covariance proche de 0 ? Dans le cas général, aucune.
* La Covariance peut être faible parce que lien entre les variables est effectivement faible.
* Mais elle peut être faible parce le lien entre les variables est non-linéaire. Il peut alors être très fort, et pourtant conduire à une faible valeur de la Covariance. Ce point très important est développé ici.
Signe de la covariance
Nous avons développé les arguments conduisant à la définition de la Covariance sur la base d'un lien positif entre X1 et X2. Mais ces arguments s'appliquent tout aussi bien dans le cas d'un lien négatif : une forte valeur positive de (X1 - µ1) rend alors probable une forte valeur négative de (X2 - µ2). Dans ce cas, la Covariance est un nombre négatif.
L'inconvénient de la covariance est que sa valeur dépend des unités dans lesquelles sont exprimées les variables X1 et X2, alors qu'une mesure de la force du lien entre deux variables ne devrait certainement pas en dépendre. C'est la raison pour laquelle, attractive pour le théoricien, la covariance est souvent délaissée par le praticien au profit de sa version standardisée, le coefficient de corrélation, que nous décrivons ici et dont la valeur ne dépend pas des unités choisies.
Si deux variables aléatoires X et Y sont indépendantes, alors leur covariance est nulle.
Mais la réciproque est fausse : deux variables aléatoires peuvent avoir une covariance nulle et pourtant ne pas être indépendantes. Par exemple, soient :
* X uniformément distribuée dans [-1, +1].
* Y = X ².
Nous laissons au lecteur le soin de montrer que
Cov(X, Y ) = 0
alors que X et Y ne sont clairement pas indépendantes.
______________________________________________________________________
|
Tutoriel |
Le Tutoriel suivant énonce et démontre les propriétés de la Covariance :
PROPRIETES DE LA COVARIANCE
|
Propriétés élémentaires Symétrie La variance est l'auto-covariance Une deuxième expression de la Covariance Une interprétation de la Covariance Linéarité par rapport aux constantes Constante multiplicative Constante additive Linéarité par rapport aux variables Variance d'une somme de variables aléatoires Covariance et indépendence |
||
|
TUTORIEL |
||
____________________________________________________________
Voir aussi :
Exemples intéressants de calcul de Covariances :
|