Résultats relatifs à la Pente en Régression Linéaire Simple

 

    1) Equation de la Droite des Moindres Carrés :

y = a + bx

où la pente est "b" (et l'ordonnée à l'origine est "a").

 

    2) Valeur de "b"

b = Cov(x, y) / Var(x)

 

ou de façon équivalente :

b = .sy /sx

 

où :

    * "" est le coefficient de corrélation de x et de y.

    * sx et sy sont les écarts-types de x et de y.

 

 

    3) Propriétés de "b" en tant qu'estimateur

        Dans ce paragraphe, il n'est pas fait d'hypothèse sur le bruit autre que :

            * La décorrélation du bruit entre deux observations quelconques.

            * La variance ² du bruit est la même sur toutes les observations (homoscedasticité).

En particulier, on ne suppose pas que le bruit est gaussien.
 

            3-a) "b" est un estimateur non biaisé de la pente B de la droite de régression.

 

E[b] = B


E désigne l'espérance.

 

 

        3-b) La variance de "b" est :

Var(b) = ²/n.Var(x)


n le nombre d'observations dans l'échantillon.

 

 

        3-c) La pente "b" et l'ordonnée à l'origine "a" sont en général corrélées.

 

Cov(a, b) = - ²./n.Var(x)

 
Remarquez que quand la moyenne  est positive, la covariance est négative : à une pente plus faible correspond le plus souvent (mais pas toujours) une ordonnée à l'origine plus grande, ce qui est intuitif.
La pente et l'ordonnée à l'origine ne sont décorrélées que quand   = 0, c'est à dire quand les données sont centrées.

 

 

    4) Distribution de "b" sous l'hypothèse d'un bruit gaussien

        Le bruit est maintenant supposé avoir une distribution normale N(0, ²).

 

        4-1) "b" a une distribution normale :

b ~ N(moyenne, variance)

 

où les valeurs de "moyenne" et de "variance" ont été données au paragraphe précédent (elles ne dépendent pas de la nature du bruit).

 

        4-2) "b" est un estimateur efficace de B, pente de la droite de régression.

            Il n'existe pas d'estimateur non biaisé de B ayant une variance inférieure à celle de "b".

 

        4-3) "b" et tout résidu ui sont des variables indépendantes.

        4-4) "b" et sont des variables normales indépendantes (il n'y a pas d'équivalent pour l'ordonnée à l'origine).

Téléchargez ce Glossaire