Ridge  (Régression)

Régression Linéaire Multiple et colinéarité

La Régression Linéaire Multiple classique est très sensible à la quasi-colinéarité des variables explicatives : celle-ci entraîne une instabilité des valeurs des paramètres du modèle (forte variance) et une perte de leur interprétabilité. Sur le plan analytique, cette quasi-colinéarité provoque un mauvais conditionnement de la matrice X'X, où X est la matrice des données : son déterminant est presque nul, et l'inversion de la matrice provoque des difficultés de calcul numérique rendant le résultat incertain.

Dans le cas de colinéarité complète (au moins une variable est une combinaison linéaire exacte des autres variables), le calcul des paramètres du modèle devient impossible.

Le même phénomène se produit lorsqu'il y a moins d'observations que de paramètres à estimer, une situation relativement fréquente : par exemple, un spectre est couramment décrit par la liste des intensités lumineuses mesurées à quelques centaines de longueurs d'onde différentes (les variables), alors que l'analyste peut n'avoir à sa disposition que quelques dizaines de spectres (les observations).

-----

Pour le praticien, la quasi-colinéarité de certains des prédicteurs entraine une grande variance (incertitude) des prédictions, rendant celles-ci inutilisables.

La Régression Ridge

Le Régression Ridge est une variante de la Régression Linéaire Multiple dont l'objectif est de de contourner l'obstacle de la colinéarité entre variables explicatives. Elle atteint ce résultat en renonçant à la méthode des Moindres Carrés (MC) pour estimer les paramètres du modèle, et en modifiant la matrice X'X pour rendre à son déterminant une valeur appréciable.

Ce faisant, elle introduit un biais sur les estimations des paramètres (alors que les paramètres obtenus par MC sont non biaisés). Ce léger inconvénient est plus que compensé par la réduction de la variance des paramètres, et même par la réduction de leur Erreur Quadratique Moyenne (EQM). Ceci est une illustration du fait qu'un estimateur biaisé mais de faible variance peut être plus performant qu'un estimateur sans biais mais de forte variance.

De plus, les erreurs de prédiction de la Régression Ridge sont plus faibles que celles de la Régression classique en cas de quasi-colinéarité :  ces prédictions sont maintenant entachées d'un biais, mais leur variance est fortement réduite, conduisant à une réduction de l'EQM. Ainsi, la Régression Ridge s'inscrit dans le cadre du "compromis biais-variance".

Paramètre Ridge

Bien entendu, ces améliorations ont un prix :

 

Néanmoins, la Régression Ridge est bien plus qu'une méthode désespérée de sauvetage de la Régression Linéaire Multiple en cas de colinéarité approchée ou exacte des variables explicatives. C'est une technique majeure de régression qui a largement prouvé son utilité dans les situations de colinéarité des variables explicatives, une situation malheureusement très fréquente.

______________________________________

 

Tutoriel 1

 

Nous commençons par expliquer en quoi la colinéarité des variables explicatives est une circonstance très défavorable pour la Régression Linéaire Multiple. Nous montrons alors comment un changement simple mais efficace de la méthode de calcul des paramètres du modèle permet de contourner le problème de la colinéarité.

Nous évaluons ensuite les propriétés statistiques des paramètres de la Régression Ridge, et constaterons qu'ils sont plus performants (réduction de l'Erreur Quadratique Moyenne, ou EQM) que les paramètres des Moindres Carrés lorsque les variables sont dans une situation proche de la colinéarité.

Nous abordons enfin la question délicate de la détermination de la valeur optimale du "paramètre ridge".

 

 

 

REGRESSION RIDGE

Colinéarité

Interprétation des valeurs des paramètres

Interprétation géométrique

Interprétation analytique

La Régression Ridge

Standardisation des variables

Trois définitions équivalentes de la Régression Ridge

Reconditionnement de la matrice X'X

Pénalisation de la Somme des Carrés des Résidus

Contrainte sur la norme du vecteur des paramètres

Calcul analytique

Interprétation géométrique

Propriétés statistiques de l'estimateur ridge

Relation avec l'estimateur des Moindres Carrés

Biais

Variance

EQM

Choisir la valeur du paramètre ridge

Qu'est-ce que la "valeur optimale" du paramètre ridge ?

Méthodes analytiques

Méthode de Hoerl

Variante Ridge du Cp de Mallows

Méthode graphique

Validation non paramétrique

TUTORIEL

____________________________________________________________

 

 

Tutoriel 2

 

Il existe un lien inattendu et très instructif entre la Régression Ridge et l'Analyse en Composantes Principale. Quand les Composantes Principales (CP) sont untilisées comme variables indépendantes dans une modèle des MC, la Régression Ridge apparaît comme une résultant d'une modification simple des paramètres du modèle : les paramètres de la régression des MC sont "rétrécis" par un facteur peu important pour les premières CP, et plus important pour les dernières CP. La Régression Ridge donne ainsi plus d'importance aux CP de forte variance, et réduit l'influence des CP de faible variance sur le modèle final.

Nous concluons en introduisant le concept de "nombre effectif de paramètres" (ou de "degrés de liberté"), qui est une mesure plus réaliste de la "souplesse" du modèle que le nombre réel de paramètres.

 

 

 

REGRESSION RIDGE ET

ANALYSE EN COMPOSANTES PRINCIPALES

Décomposition en valeurs singulières

Régression Ridge exprimée sous forme singulière

Solution des Moindres Carrés

Solution "Ridge"

Régression Ridge et Composantes Principales

EQM des paramètres

Nombre effectif de degrés de liberté (ou de paramètres)

TUTORIEL

 

________________________________________

 

 

Voir aussi:

Régression Linéaire Multiple

Colinéarité

Erreur Quadratique Moyenne

Compromis biais-variance

Décomposition en Valeurs Singulières

 

 

 

 

Téléchargez ce Glossaire