Voir "Validation".
En Régression Linéaire (Simple ou Multiple), toute prédiction yi* peut s'exprimer comme une combinaison linéaire des observations yj :
yi* = Sj hij yj
Le coefficient de l'observation yi, soit hii , s'appelle le levier de l'observation i. Plus grand est hii, plus importante est la contribution de yi à yi*.
On montre que :
0
hii
1
Les leviers ne dépendent que des {xj}, et sont donc des quantités fixes, non aléatoires.
On montre qu'une observation ayant un levier élevé (c.à.d. sensiblement supérieur
à la moyenne p/n, où n est le nombre d'observations) est situé
"en périphérie" du domaine des prédicteurs. Une telle observation s'appelle
un "point de levier".
Le levier utilisé seul est d'une utilité limitée, car il ne prend pas en compte le résidu de l'observation. Par contre, les mesures classiques d'influence d'une observation sur les prédictions du modèle (p. ex. DFFITS, distance Cook) combinent étroitement leviers et résidus. Les observations ayant des leviers élevés apparaissent alors comme celles ayant le la plus grande influence sur les prédictions du modèle.
-----
Ces quantités sont explicitées et leur propriétés énoncées dans un des Tutoriels sur la Régression Linéaire.
____________________
Linéaire (Modèle)
Attention, ce terme a un double sens.
Quelques exemples :
D'une façon générale, les modèles linéaires dans
les paramètres sont plus simples mais généralisent
moins bien que des modèles plus puissants, non linéaires dans les paramètres,
comme les Réseaux de neurones.