Chi-2 (Tests du)
Nom générique d'une importante famille de tests non paramétriques.
Bien que les tests du Chi-2 se présentent sous des formes très différentes, ils sont tous des variantes du test d'adéquation relatif à la distribution multinomiale basé sur la statistique dite "du Chi-2", qui est décrite ci-dessous.
La famille tire son nom du fait que la distribution de la statistique du Chi-2 sous H0, bien qu'inconnue en général, converge toujours en loi vers une distribution du χ2 pour des échantillons de plus en plus grands (distribution "asymptotique"). Le nombre de degrés de liberté de cette distribution limite dépend du problème particulier considéré (voir Tutoriels ci-dessous).
Les tests du Chi-2 sont donc toujours des tests approximatifs, et plus précisément des tests asymptotiques.
La distribution multinomiale Mult(n; p1, p2, ..., pk ) est définie par :
* Les k probabilités p1, p2, ..., pk avec Σi pi = 1,
* Et le nombre d'observations n tirées de cette distribution.
Nous noterons ni le nombre d'observations tirées dans la modalité i ("effectif" de la modalité). Nous avons donc Σi ni = n.
Mult(n; {pi }) est la distribution de probabilité du vecteur k-dimensionnel {n1, n2, ..., nk }.
Supposons que les probabilités {pi} ne soient pas connues mais que l'on considère comme plausible qu'elles soient égales à certains nombres {πi} connus, et donc que l'on ait pi = πi pour tout i. Pour évaluer la vraisemblance de cette hypothèse, il faut un test d'adéquation (ou "d'adaptation") qui opposera :
* L'hypothèse nulle H0 : p1 = π1, p2 = π2, ..., pk = πk
* A l'hypothèse alternative H1 : au moins une de ces égalités est fausse.
Le test a besoin d'une statistique dont la valeur sur l'échantillon soit un bon indicateur de la plausibilité de l'hypothèse nulle. La statistique la plus utilisée pour ce test est la statistique dite "du Chi-2" que nous décrivons maintenant.
La statistique du Chi-2, que nous noterons Q, est définie par
|
|
Bien qu'étant la plus connue, cette statistique
(dite "de Pearson") n'est pas la seule possible. En particulier, on
peut construire un test d'adéquation par la méthode générale
du Test du Rapport de Vraisemblance : la statistique de ce test est appelée
"G²
de Wilks".
La statistique du Chi-2 est donc la somme de k termes similaires, un terme par modalité.
* Le numérateur de chacun des termes est tout à fait naturel : c'est le carré de la différence entre l'effectif observé ni et l'effectif attendu npi (rappelons que ni /n est l'estimateur par Maximum de Vraisemblance de pi).
* Nous donnons ici une justification du dénominateur npi, quelque peu inattendu.

La distribution de Q est inconnue, mais on montre qu'elle converge vers χ2k - 1 quand la taille de l'échantillon tend vers l'infini (théorème de Pearson). Ce résultat fondamental est à l'origine de tous les tests du Chi-2.
-----
Si l'on note :
* Oi les effectifs observés,
* Et Ei les effectifs attendus,
la statistique du Chi-2 s'écrit
|
|
Une fois l'échantillon tiré, la valeur de Q est calculée.
* Q ne peut prendre une grande valeur que si au moins un des termes de la somme prend une grande valeur, c'est à dire si l'effectif observé est très différent de l'effectif attendu pour au moins une modalité. Il est alors naturel de rejeter l'hypothèse nulle.
* Q ne peut prendre une petite valeur que si tous les termes de la somme ont de faibles valeurs, c'est à dire si tous les effectifs sont proches de leur valeur attendue. Il n'est alors certainement pas possible de rejeter l'hypothèse nulle.
On peut remarquer que si tous les effectifs ni sont multipliés par m, la valeur de la statistique Q est également multipliée par m. Ainsi, bien que les rapports des effectifs soient inchangés, l'hypothèse nulle devient plus difficile à accepter. Ceci reflète le fait que la quantité d'information sur une distribution augmente avec la taille de l'échantillon.
Le test du Chi-2 décrit ci-dessus peut être transformé en un test d'adéquation pour les distributions continues. Soit p(x) une distribution de probabilité continue, et x = {x1, x2, ..., xn } un échantillon tiré d'une distribution continue inconnue. Est-il vraisemblable que cette distribution inconnue soit justement p(x) ?
Supposons que le domaine de p(x) soit découpé en k tranches (image inférieure de l'illustration ci-dessus). La probabilité pi pour qu'une nouvelle observation tombe dans la tranche n°i est

où ai et bi sont les bornes inférieure et supérieure de la tranche.
La situation est alors identique à celle du test d'adéquation de la distribution multinomiale Mult(n; p1, p2, ..., pk ), où k est le nombre de tranches.
-----
La discrétisation de p(x) en un nombre fini de probabilités {pi} provoque une perte d'information : beaucoup de distributions continues peuvent engendrer le même ensemble de probabilités {pi}. Le choix de k est alors une question importante :
* Si k est trop petit (et donc si les tranches sont trop larges), la perte d'information sur la structure détaillée de {pi} est trop importante : le test ne peut distinguer entre des distributions pourtant très différentes, et sa puissance est faible.
* Mais si k est trop grand, le nombre moyen d'observations par modalité est faible, une circonstance connue pour rendre le test du Chi-2 imprécis.
Ce point est une des manifestations du compromis biais-variance (voir ici), et est utilement illustré par une animation étudiant le comportement de la statistique du Chi-2 dans diverses conditions expérimentales.
Cette même animation apporte également des arguments en faveur du positionnement des limites des tranches de façon à ce que celles-ci définissent des probabilités approximativement égales.
-----
De nombreux tests d'adéquation, plus particulièrement conçus pour les distributions continues, remplissent exactement la même fonction que la version "distributions continues" du test du Chi-2 d'adéquation, et en général avec de meilleurs résultats (plus grande puissance).
Considérons le test du Chi-2 destiné à tester l'hypothèse nulle selon laquelle l'échantillon est issu de la distribution normale N(µ, σ²), où µ et σ² sont connus. Si la distribution normale est découpée en k tranches, la distribution asymptotique de la statistique du Chi-2 est χ2k - 1.
Considérons maintenant un autre test destiné à tester l'hypothèse nulle selon laquelle l'échantillon a été tiré d'une distribution normale pour la quelle µ et σ² ne sont pas spécifiés. Il est encore possible de construire un test du Chi-2 pour tester cette hypothèse nulle à condition de construire dans un premier temps une distribution normale "de référence". L'hypothèse à tester sera alors "L'échantillon est issu de cette distribution normale de référence".
La distribution de référence est spécifiée en estimant sa moyenne et sa variance à partir de l'échantillon, en général par la méthode d'estimation du Maximum de Vraisemblance. On montre alors que la distribution asymptotique de la statistique du Chi-2 sera toujours une distribution du χ2, mais χ2k - 3 au lieu de
χ2k - 1. En d'autres termes, l'estimation des deux paramètres de la distribution normale aura pour conséquence la perte de deux degrés χ2de liberté de la distribution asymptotique.
-----
Sous certaines conditions de régularité, ce résultat est absolument général et s'étend bien au-delà de l'exemple ci-dessus. Il s'énonce ainsi : à chaque fois qu'un des paramètres rencontrés lors de la construction d'un test du Chi-2 est inconnu et doit donc être estimé (p. ex. par Maximum de Vraisemblance):
* La distribution asymptotique de la statistique du Chi-2 reste une distribution du χ2,
* Mais dont le nombre de degrés de liberté doit être diminué d'une unité.
Ce résultat important est difficile, et n'est pas démontré dans ce Glossaire.
Les tests du Chi-2 les plus fréquemment utilisés portent sur les tableaux de contingence.
Soient X1 et X2 deux variables discrètes. La distribution de probabilité conjointe de la paire (X1, X2 ) est définie par un ensemble de probabilités pij (inconnues). Un échantillon est tiré de cette distribution conjointe. Le résultat est un ensemble d'effectifs {nij}, où i désigne la modalité n°i de X1 et j désigne la modalité n°j de X2. Ces effectifs sont en général représentés sous la forme d'une table appelée tableau de contingence :

Le contenu du tableau de contingence est-il un argument en faveur de la thèse selon laquelle X1 et X2 ne sont pas des variables indépendantes ?
Nous verrons qu'une version du test du Chi-2 permet de tester :
* H0 : X1 et X2 sont indépendantes
contre
* H1 : X1 et X2 ne sont pas indépendantes.
____________________
Lorsque le test rejette H0, il ne fournit malheureusement pas d'information sur la façon dont les deux variables s'éloignent de la condition d'indépendance. Une analyse plus détaillée de la paire (X1, X2) est alors possible en ayant recours à l'Analyse des Correspondances.
Quand les deux variables ont le même nombre de modalités, le tableau de contingence est carré. Une autre question se pose alors naturellement : le contenu du tableau est-il compatible avec l'hypothèse selon laquelle la distribution conjointe sous-jacente est symétrique ? En d'autres termes, la probabilité de l'évènement (X1i, X2j ) est-elle la même que celle de l'évènement (X1j, X2i ) ?
Nous verrons qu'une autre variante du test du Chi-2 peut résoudre la question.
La quantité sous-jacente à un tableau de contingence est la distribution de probabilité conjointe Pij{X1 = X1i, X2 = X2j }. Cependant, de cette distribution on peut déduire les distributions marginales de X1 et de X2, qui sont les distributions de probabilité de X1 et de X2 au sens ordinaire du terme.
Quand les deux variables ont le même nombre de modalités, une question naturelle est "Les deux variables ont-elles des distributions de probabilités marginales identiques ?".
A nouveau, une variante du test du Chi-2 permet de répondre à cette question.
Un problème quelque peu différent est le suivant : soient I variables discrètes indépendantes prenant toutes leurs valeurs dans un ensemble de J valeurs
{v1, v2, ..., vJ }. Des échantillons de tailles respectives {n1, n2, ..., nI } sont tirés des distributions de ces variables. Par exemple, les n1 tirages de X1 conduisent aux effectifs suivants :
n11, n12, ..., n1J avec Σi n1j = n1
et des notations similaires pour X2.

Au vu de ce tableau, est-il vraisemblable que les I variables aient des distributions de probabilité identiques ?
Ce problème sera résolu par une variante du test du Chi-2.
-----
Le test d'identité du Chi-2 peut être adapté aux distributions continues par le même procédé que celui utilisé pour adapter le test d'adéquation. Il devient alors une alternative :
* Au test de Mann-Whitney pour la comparaison de deux distributions,
* Et au test de Kruskal-Wallis pour la comparaison de plus de deux distributions.
_______________________________________________
|
Tutoriel 1 |
Le test du Chi-2 d'indépendance aborde la question de l'indépendance de deux variables discrètes. Si les variables sont effectivement indépendantes, le contenu du tableau de contingence croisant ces deux variables ne devrait pas s'éloigner beaucoup d'une certaine structure canonique. L'écart observé du tableau de contingence à cette structure canonique est mesuré par la valeur d'une forme particulière de la statistique du Chi-2. Le test utilise alors le fait que la distribution asymptotique de la statistique est une distribution du χ2, dont nous calculerons le nombre de degrés de liberté.
LE TEST DU CHI-2 D'INDEPENDANCE
|
Le test du Chi-2 d'indépendance Tableau de contingence Effectifs marginaux Les hypothèses nulle et alternative Probabilités marginales Indépendance et distribution de probabilité conjointe Le tableau de contingence suit une distribution multinomiale La statistique du Chi-2 Estimation des probabilités Estimation des probabilités marginales Estimation des probabilités conjointes Degrés de liberté Nombre de paramètres estimés Nombre de degrés de liberté Relation fonctionnelle entre deux variables Valeur maximale de la statistique du Chi-2 Relation fonctionnelle Contributions à la statistique du Chi-2 La statistique du Chi-2 perd de l'information Contributions à la statistique du Chi-2 |
||
|
TUTORIEL |
||
____________________________________________________________
|
Tutoriel 2 |
Nous décrivons maintenant trois autres tests du Chi-2 classiques :
* Le test "de symétrie", qui porte sur la symétrie de la distribution conjointe ayant engendrée le tableau de contingence. La phase d'optimisation lagrangienne des probabilités est simple si elle est précédée d'une mise en forme appropriée des données.
* Le test "des marginales", qui aborde la question de l'identité des distributions de probabilités marginales d'une distribution de probabilité conjointe.
* Le test "d'identité" (ou "d'homogénéité") qui cherche à déterminer si plusieurs distributions discrètes sont ou non identiques.
AUTRES TESTS DU CHI-2
|
Tester la symétrie d'une distribution conjointe Estimation des probabilités par optimisation lagrangienne Nombre de degrés de liberté Tester l'identité des distributions marginales Les hypothèses Estimation des probabilités Nombre de degrés de liberté La symétrie implique l'identité des marginales Tester l'identité de plusieurs distributions Identité des populations Identifier la statistique du test Estimation des probabilités Nombre de degrés de liberté Comparaison avec le test d'indépendance |
||
|
TUTORIEL |
||
______________________________________________________
|
Tutoriel 3 |
Ce Tutoriel est consacré aux tableaux 2x2. Nous montrerons que :
1) La statistique du Chi-2 prend alors une forme particulièrement simple.
2) Alors que les tests du Chi-2 sont des tests approximatifs, il est dans certains cas possible de développer des test exacts qui ne sont pas basés sur la statistique du Chi-2. C'est en particulier le cas :
* Du test de Fisher-Irwin qui aborde la question de l'identité des distributions de deux variables dichotomiques (variables de Bernoulli). Le test considère deux populations, chacune divisée en deux sous-populations, la question étant de savoir si ces deux divisions définissent des proportions identiques dans les deux populations.
* Du test exact de Fisher, qui traite de l'indépendance de deux variables dichotomiques. Nous développerons dans un premier temps un argument intuitif en faveur de la nature hypergéométrique de la distribution (conditionnelle) de la statistique du test, puis nous démontrerons rigoureusement ce résultat.
-----
Bien que ces tests aient été développés aux environs de 1930, leur utilité réelle est encore débattue à ce jour. Nous n'aborderons pas cette question, et ne traiterons que de la partie mathématique des tests (distributions des statistiques de test).
3) Le test de McNemar, qui traite de la question de la symétrie d'une distribution de probabilité conjointe 2x2.
CAS DES TABLEAUX 2x2
|
La statistique du Chi-2 pour les tableaux 2x2 Test de Fisher-Irwin Test exact de Fisher Argument intuitif Distribution conditionnelle de la statistique Numérateur Dénominateur La disribution est hypergéométrique Test exact de Fisher unilatéral Test de McNemar |
||
|
TUTORIEL |
||
______________________________________________________
Voir aussi :