|
Animation interactive |
En mathématiques, la pente est la tangente de l'angle entre l'axe des x et une droite.
En Modélisation de Données, le terme "pente" se rencontre en Régression Linéaire Simple (RLS). Il fait alors référence :
* soit à la pente de la Droite de Régression,
* soit à la pente de la Droite des Moindres Carrés (DMC).
Deux paramètres sont nécessaires pour définir
une droite, et l'autre paramètre est le plus souvent l'Ordonnée
à l'Origine.
L'interprétation de la pente est simple : à un déplacement
de dx le long de l'axe des x correspond un déplacement dy
le long de l'axe des y, avec
dy = dx.Pente
|
|
La pente est donc le taux de variation de y
quand x varie (mais sa valeur numérique dépend des unités choisies sur
les axes).
La DMC dépend de l'échantillon.
Il en est de même pour la pente, qui est donc une variable aléatoire. Sous les
hypothèses standard de la RLS, la distribution de la pente est bien comprise,
et peut être calculée exactement.
L'animation suivante illustre la distribution
de la pente sous diverses "conditions expérimentales".
|
|
L'illustration propose : * Une droite de régression (en rouge), * Un échantillon, * La Droite des Moindres Carrés (DMC) correspondante (en bleu), ainsi qu'une représentation graphique de la pente de cette droite.
Pour obtenir une autre droite de régression, cliquez sur "New".
Notez que les points de l'échantillon sont équidistants en x. Ceci peut apparaître comme une restriction sévère, mais tel n'est pas le cas : * D'abord, une telle situation n'est pas inhabituelle en pratique. * Mais surtout, la RLS ne
considère pas x comme une variable aléatoire (seul y
est aléatoire). La distribution de la pente ne dépend que du nombre de points, de l'écart-type
en x de l'échantillon, et du niveau de bruit. Ces quantités restent constantes
quand on passe d'un échantillon au suivant. Ne considérer que des échantillons
constitué de points équidistants est donc une restriction, mais qui ne remet
pas en cause la validité de la démonstration. * La moyenne de cette gaussienne est la pente de la droite de régression (qui, dans la réalité, est inconnue). Ceci est une conséquence du fait que la pente de la DMC est un estimateur non biaisé de la pente de la droite de régression. * La variance de la gaussienne est la variance théorique de la distribution de la pente de la DMC.
* Ajouter une même quantité à toutes les abscisses, * Et/ou ajouter une même quantité
à toutes les ordonnées |
_______________________________________________
Vous trouverez ici un résumé des principaux résultats relatifs à la Pente en RLS (équation, propriétés en tant qu'estimateur, distribution).
_____________________________________________________________
Voir aussi :