UN EXEMPLE REALISTE DE REGRESSION LINEAIRE SIMPLE

OU VAR(Y) EST EFFECTIVEMENT PROPORTIONNEL A "X"



Soit T une tâche devant être exécutée de façon répétitive. Par exemple, T pourrait être "Parcourir 1 km sur une route de type donné", ou "Enfoncer un clou dans une planche".
La durée nominale de T est d minutes, mais en raison de variations mineures et incontrôlables des conditions d'exécution, la durée de T est en fait une variable aléatoire t, de moyenne d et de variance ².
T doit être exécutée n fois de suite. Nous supposons que la durée de la ième exécution est indépendante de la durée de toute autre exécution. Quelle est la durée tn nécessaire aux n exécutions de T ?

Pour un n donné, tn est une variable aléatoire.
L'espérance de la somme de variables aléatoires est la somme des espérances de chacune des variables, donc l'espérance de  tn est :

E(tn) = E(t) + ... + E(t)  = d + ... + d =  n.d


La variance de la somme de variables aléatoires indépendantes (ou plus précisément, décorrélées) est la somme des variances de chacune des variables. La variance de  tn est donc :

var(tn) = var(t) + ... + var(t) = n.var(t) = ² + ... + ² = n.²


Donc la variance de la durée nécessaire à l'accomplissment de n tâches T est proportionnelle à n.

Supposons maintenant que nous disposions de mesures de tn pour diverses valeurs de n. Nous voulons estimer d, la valeur nominale inconnue de la durée de T.
Nous sommes convaincus que, ne serait le caractère aléatoire de t, nous aurions tn = n.d  , c'est à dire que la relation entre tn et n est linéaire. Il semblerait donc que la Régression Lineaire Simple soit l'outil approprié pour estimer d, pente de la Droite des Moindres Carrés.
Mais comme nous avons montré que la variance de la variable à expliquer (tn) est proportionnelle à la valeur de la variable indépendante n, nous concluons que la pente de la Droite des Moindres Carrés Pondérés fournira une meilleure estimation de d que celle de la Droite des Moindres Carrés (ordinaires).