V de Rao

Le V de Rao est une des statistiques utilisées en Analyse Discriminante pour mesurer le degré de séparation entre classes.

Définition du V de Rao

Le V de Rao est égal, par définition, à la somme des carrés des distances (de Mahalanobis) des centres des divers groupes au barycentre global, les distances étant pondérées par les effectifs des groupes.

V = Sini(gi - g)'W*-1(gi - g)

où :

    * les gi est le centre du groupe n°i, d'effectif ni,

    * g est le barycentre global,

    * W*-1 est la matrice de dispersion intraclasses estimée à partir des observations.

Le test

Alors, sous l'hypothèse nulle :

    * Les variables sont normalement distribuées,

    * Les matrices de covariances des classes sont identiques,

    * Les centres des classes sont confondus,

la statistique V suit approximativement une loi en Chi-2.

Il est donc possible de tester l'hypotèse nulle selon laquelle les classes ont des moyennes égales, sous réserve que les deux autres conditions de l'hypothèse nulle soit satisfaites.

V de Rao et sélection de variables

Le V de Rao est également utilisé pour la sélection de variables en analyse Discriminante. On sait construire une statistique approximativement distribuée en Chi-2 et qui est une fonction des V de Rao relatifs :

    * A un certain sous-ensemble de variables,

    * Et à ce même sous-ensemble augmenté d'une variable supplémentaire.

Un test du Chi-2 permet alors de déterminer laquelle des variables non encore incorporées au modèle augmente le plus la séparabilité des classes.

Conditions d'application du test du V de Rao

Comme ANOVA, le test du V de Rao exige le respect de conditions sévères :

    * Les variables doivent normalement distribuées.

    * Les classes dont sont issus les groupes d'observation doivent avoir des matrices de covariance identiques. Cette condition est en général testée par le test de Box.

Autres test de séparabilité des classes

Il existe de nombreux autres critères conçus pour tester l'hypothèse nulle selon laquelle les classes ont des moyennes identiques. Mentionnons :

    * Le Lambda de Wilks.

    * La trace de Pillai.

    * Le gcr (greatest characteristic root) de Roy.

    * La trace de Lawley-Hotelling.

 ____________________________________________________________

 

Voir aussi:

ANOVA

Analyse Discriminante

Lambda de Wilks

Téléchargez ce Glossaire