Résultats relatifs à la l'Ordonnée à l'Origine en Régression Linéaire Simple

 

    1) Equation de la Droite des Moindres Carrés :

y = a + b.x

où l'ordonnée à l'origine est "a" (et la pente est "b").

 

    2) Valeur de "a"

a = - b.

 

où :

    * "b" est la pente,

b = cov(x, y)/var(x)

    *   et  sont les moyennes en x et en y de l'échantillon..

 

 

    3) Propriétés de "a" en tant qu'estimateur

        Dans ce paragraphe, il n'est pas fait d'hypothèse sur le bruit autre que :

            * La décorrélation du bruit entre deux observations quelconques.

            * La variance ² du bruit est la même sur toutes les observations (homoscedasticité).

En particulier, on ne suppose pas que le bruit est gaussien.
 

            3-a) "a" est un estimateur non biaisé de l'ordonnée à l'origine A de la droite de régression.

 

E(a) = A


où E désigne l'espérance.

 

 

        3-b) La variance de "a" est :

var(a) = (²/n).(1 + ²/var(x))


n le nombre d'observations dans l'échantillon.

 

Cette expression montre clairement l'influence de la position de l'axe vertical y sur la variance de l'ordonnée à l'origine. En particulier, var(a) est minimale quand   = 0,  c.à.d. quand les données sont centrées : var(a) est alors égale à ²/n.

 

 

        3-c) L'ordonnée à l'origine "a" et la  pente "b" sont en général corrélées.

 

Cov(a, b) = - ²./n.var(x)

 
Remarquez que quand la moyenne  est positive, la covariance est négative : à une ordonnée à l'origine plus faible correspond le plus souvent (mais pas toujours) une pente plus grande, ce qui est intuitif.
L'ordonnée à l'origine et la pente ne sont décorrélées que quand = 0, c'est à dire quand les données sont centrées. Rappel : c'est également dans cette situation que la variance de l'ordonnée à l'origine est minimale.

 

 

    4) Distribution de "a" sous l'hypothèse d'un bruit gaussien

        Le bruit est maintenant supposé avoir une distribution normale N(0, ²).

 

        4-1) "a" a une distribution normale :

a ~ N(moyenne, variance)

 

où les valeurs de "moyenne" et de "variance" ont été données au paragraphe précédent (elles ne dépendent pas de la nature du bruit).

 

        4-2) "a" est un estimateur efficace de A, ordonnée à l'origine de la droite de régression.

            Il n'existe pas d'estimateur non biaisé de A ayant une variance inférieure à celle de "a".

 

        4-3) "a" et tout résidu ui sont des variables indépendantes.

Téléchargez ce Glossaire