Résultats relatifs à la l'Ordonnée à l'Origine en Régression Linéaire
Simple
1) Equation de la Droite des Moindres Carrés :
y = a + b.x
où l'ordonnée à l'origine est "a" (et la pente est "b").
2) Valeur de "a"
|
a = |
où :
* "b" est la pente,
b = cov(x, y)/var(x)
*
et
sont
les moyennes en x et en y de l'échantillon..
3) Propriétés de "a" en tant qu'estimateur
Dans ce paragraphe, il n'est pas fait d'hypothèse sur le bruit autre que :
* La décorrélation du bruit entre deux observations quelconques.
*
La variance
²
du bruit est la même sur toutes les observations (homoscedasticité).
En particulier, on ne suppose pas que le bruit
est gaussien.
3-a) "a" est un estimateur non biaisé de l'ordonnée à l'origine A de la droite de régression.
|
E(a) = A |
où E désigne l'espérance.
3-b) La variance de "a" est :
|
var(a) = ( |
où n le nombre d'observations dans l'échantillon.
Cette expression montre clairement l'influence de
la position de l'axe vertical y sur la variance de l'ordonnée à l'origine.
En particulier, var(a) est minimale quand
= 0, c.à.d. quand les données sont centrées : var(a) est alors égale à
²/n.
3-c) L'ordonnée à l'origine "a" et la pente "b" sont en général corrélées.
|
Cov(a, b) = - |
Remarquez que quand la moyenne
est
positive, la covariance est négative : à une ordonnée à l'origine plus faible correspond le
plus souvent (mais pas toujours) une pente plus grande, ce qui
est intuitif.
L'ordonnée à l'origine et la pente ne sont décorrélées
que quand
= 0, c'est à dire quand les données sont centrées. Rappel : c'est également
dans cette situation que la variance de l'ordonnée à l'origine est minimale.
4) Distribution de "a" sous l'hypothèse d'un bruit gaussien
Le
bruit est maintenant supposé avoir une distribution normale N(0,
²).
4-1) "a" a une distribution normale :
|
a ~ N(moyenne, variance) |
où les valeurs de "moyenne" et de "variance" ont été données au paragraphe précédent (elles ne dépendent pas de la nature du bruit).
4-2) "a" est un estimateur efficace de A, ordonnée à l'origine de la droite de régression.
Il n'existe pas d'estimateur non biaisé de A ayant une variance inférieure à celle de "a".
4-3) "a" et tout résidu ui sont des variables indépendantes.