Résultats relatifs à la Pente en Régression Linéaire Simple
1) Equation de la Droite des Moindres Carrés :
y = a + bx
où la pente est "b" (et l'ordonnée à l'origine est "a").
2) Valeur de "b"
|
b = Cov(x, y) / Var(x) |
ou de façon équivalente :
|
b = |
où :
* "
"
est le coefficient
de corrélation de x et de y.
* sx et sy sont les écarts-types de x et de y.
3) Propriétés de "b" en tant qu'estimateur
Dans ce paragraphe, il n'est pas fait d'hypothèse sur le bruit autre que :
* La décorrélation du bruit entre deux observations quelconques.
*
La variance
²
du bruit est la même sur toutes les observations (homoscedasticité).
En particulier, on ne suppose pas que le bruit
est gaussien.
3-a) "b" est un estimateur non biaisé de la pente B de la droite de régression.
|
E[b] = B |
où E désigne l'espérance.
3-b) La variance de "b" est :
|
Var(b) = |
où n le nombre d'observations dans l'échantillon.
3-c) La pente "b" et l'ordonnée à l'origine "a" sont en général corrélées.
|
Cov(a, b) = - |
Remarquez que quand la moyenne
est
positive, la covariance est négative : à une pente plus faible correspond le
plus souvent (mais pas toujours) une ordonnée à l'origine plus grande, ce qui
est intuitif.
La pente et l'ordonnée à l'origine ne sont décorrélées
que quand
= 0, c'est à dire quand les données sont centrées.
4) Distribution de "b" sous l'hypothèse d'un bruit gaussien
Le
bruit est maintenant supposé avoir une distribution normale N(0,
²).
4-1) "b" a une distribution normale :
|
b ~ N(moyenne, variance) |
où les valeurs de "moyenne" et de "variance" ont été données au paragraphe précédent (elles ne dépendent pas de la nature du bruit).
4-2) "b" est un estimateur efficace de B, pente de la droite de régression.
Il n'existe pas d'estimateur non biaisé de B ayant une variance inférieure à celle de "b".
4-3) "b" et tout résidu ui sont des variables indépendantes.
4-4)
"b" et
sont des variables normales indépendantes (il n'y a pas d'équivalent pour
l'ordonnée à l'origine).