Animation interactive

t  (Test)

L'expression "test t (de Student)" recouvre en fait plusieurs tests d'inspiration commune, et qui portent sur la crédibilité :

    * De la valeur de la moyenne empirique d'un échantillon issu d'une population normale comme estimation de la valeur de la moyenne (inconnue) de cette population (test t à un échantillon).

    * De la valeur de la différence des moyennes empiriques de deux échantillons issus de deux populations normales comme estimation de la différence des moyennes de ces deux populations (test t à deux échantillons).

Test t à un échantillon et valeur de référence

L'échantillon suivant est issu d'une population normale réputée avoir pour moyenne la valeur µ0. Il pourra s'agir, par exemple, des diamètres mesurés d'un certain nombre de pièces mécaniques usinées par une machine réglée pour produire des pièces de diamètre µ0.

 

 

 

La moyenne des valeurs des observations de l'échantillon est égale à , qui est légèrement différent de µ0. Cette différence est-elle significative ? Autrement dit, la différence entre et µ0 est-elle tellement importante qu'elle contredit clairement l'affirmation selon laquelle la moyenne de la population normale est effectivement µ0 (machine bien réglée) ?

Dans le vocabulaire des tests, il s'agit donc de tester :

    * L'hypothèse nulle H0 : µ = µ0, où µ est la vraie valeur de la moyenne de la population normale, et où µ0 porte alors le nom de "valeur de référence",

    * Contre l'hypothèse alternative H1 : µ  µ0.

-----

Plus grande est la valeur absolue de la différence ( - µ0), plus nous serons enclins à rejeter l'hypothèse nulle au profit de l'hypothèse alternative, et ( - µ0) apparaît donc comme une statistique de test plausible : c'est une variable normale centrée (lorsque H0 est vraie) de variance σ²/n. Cependant, elle n'est pas utilisable en l'état car sa distribution, lorsque H0 est vraie, dépend de la variance σ² de la population mère.

Deux situations se présentent alors :

Variance connue

Si la variance σ² est connue, il suffit de standardiser ( - µ0) en la divisant par son propre écart-type pour obtenir une variable normale standard N(0, 1), et donc dont la distribution ne dépend pas de σ² :

 

n est la taille de l'échantillon.

 

        * Test bilatéral

L'hypothèse nulle est alors rejetée au niveau de risque α si la valeur de z est supérieure à zα/2 où inférieure à -zα/2, où zα/2 est la valeur pour laquelle l'aire sous la gaussienne standard à la droite de zα/2 est égale à α/2.

 

 

 

        * Test unilatéral

L'hypothèse alternative peut être plus restrictive que la seule H1 : µ  µ0. Par exemple, l'hypothèse H1 : µµ0 énonce que, non seulement la moyenne µ est différente de µ0, mais plus précisément qu'elle est supérieure à µ0. Il est alors naturel de rejeter l'hypothèse nulle en faveur de l'hypothèse alternative si la valeur de z est largement supérieure à 0, un argument en faveur d'une valeur de µ supérieure à µ0.

La région critique est alors définie par :

z > zα 

 

Variance inconnue

La variance de la population est malheureusement le plus souvent inconnue, et l'expression de z ci-dessus n'est alors plus utilisable puisqu'elle contient σ.

Nous sommes exactement dans la situation qui nous a amenés à définir la distribution t de Student. Nous pouvons donc affirmer que la statistique Tn obtenue en remplaçant dans l'expression de z l'écart-type vrai σ par :

suit la distribution tn - 1 à (n - 1) degrés de liberté.

 

Tn ~ tn - 1

 

 

Le test se conduit alors exactement comme dans le cas où la variance est connue, la distribution normale standard de la statistique z devant simplement être remplacée par la distribution tn - 1 de la statistique Tn.

Test t à deux échantillons

Nous venons de concevoir un test relatif à l'égalité d'une moyenne et d'une valeur de référence fixe.

Nous abordons maintenant la généralisation de cette question à la comparaison des moyennes de deux populations normales. Il est présumé que ces deux populations ont la même moyenne (H0 : µ1 = µ2 ), et la question est de savoir si la différence entre les moyennes des deux échantillons est suffisamment importante pour contredire cette hypothèse (H1 : µ1  µ2 ).

On distingue deux cas : échantillons indépendants et échantillons appariés.

Test t à deux échantillons indépendants

On dispose de deux lots de pièces mécaniques de conceptions identiques.

    * Le premier lot contient n1 pièces usinées par une première machine M1 réglée pour produire des pièces de diamètre µ1.

    * Le deuxième lot contient n2 pièces usinées par une deuxième machine M2 réglée pour produire des pièces de même diamètre µ1. Cependant, on ne peut écarter la possibilité que cette deuxième machine ait un réglage légèrement différent de celui de la première, et on considèrera donc que les pièces usinées par M2 ont en moyenne un diamètre µ2, dont on pense qu'il est égal à µ1.

On mesure les diamètres des pièces des deux lots, et les moyennes de ces deux séries de mesures sont notées respectivement 1 et 2.

 

 

 

La question est de savoir si la différence (2 - 1) est suffisamment importante pour contredire l'hypothèse selon laquelle les deux machines ont des réglages identiques, et donc que  µ1 = µ2.

A nouveau, nous utiliserons (2 - 1) comme point de départ de la construction de la statistique de test. Les deux populations étant normales et indépendantes, (2 - 1) a une distribution normale, centrée si effectivement µ1 = µ2 (H0 vraie).

 

    * Variances connues

Si les variances σ1² et σ2² des deux populations sont connues, la variance de (2 - 1) est connue car :

        - 1 a pour variance σ1² / n1.

        - 2 a pour variance σ2² / n2.

        - (2 - 1) a donc pour variance σ1² / n1 + σ2² / n2.

et nous sommes ramenés au cas d'un échantillon avec valeur de référence (ici, 0).

 

    * Variances inconnues

Si les variances sont inconnues, il faut distinguer le cas où les variances sont supposées égales de celui où ne formule pas cette hypothèse supplémentaire.

 

        - Variances égales

On suppose que les deux populations normales sont de même variance σ², mais que la valeur de cette variance est inconnue. Il nous faut donc identifier un estimateur de la variance.

Nous montrerons que la quantité

 

appelée "estimateur aggrégé de la variance", est un estimateur sans biais de la variance commune σ².

Nous en déduirons que la statistique

 

 

 

suit la distribution tn1 + n2 - 2 , qui ne dépend pas de σ, et qui est donc utilisable comme statistique de test.

Tout se passe alors comme pour le test à un échantillon : l'hypothèse nulle est rejetée en faveur de l'hypothèse alternative si la valeur de T est dans la région critique définie par la valeur choisie pour le niveau de risque α.

 

Cette animation illustre le test t à deux échantillons indépendants avec variances inconnues mais égales.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

Cadre supérieur

Echantillons

Plutôt que de représenter deux distributions normales indépendantes de même moyenne et de même variance, nous ne représentons qu'une seule distribution normale dont nous tirons deux échantillons indépendants.

Cette distribution est de moyenne nulle et de variance fixe et égale à 1. Ceci n'est pas une restriction car le test repose sur la standardisation de la distribution originale, de moyenne et de variance quelconques.

Faites varier les tailles des échantillons avec les boutons "Size 1" et "Size 2".

 

Estimation aggrégée de la variance

A chaque fois que vous cliquez sur "Next", deux nouveaux échantillons sont tirés de la distribution normale. Sous le cadre supérieur sont alors affichées les valeurs :

     * De la différence des moyennes empiriques (traits verticaux fins rouge et bleu).

     * De l'estimateur aggrégé de la variance (voir ci-dessus).

 

Cadre inférieur

Distribution t

La courbe rouge représente la distribution t de la statistique du test. Son nombre de degrés de liberté est égal à la somme des tailles des deux échantillons moins 2 (voir ci-dessus). Ce nombre est affiché dans le coin supérieur droit du cadre.

Observez les modifications de la forme de la distribution quand les tailles des échantillons varient. En particulier, cette forme ne dépend que de la somme des tailles des échantillons, et non des valeurs individuelles de ces tailles. Autrement dit, la distribution de la statistique du test ne dépend que du nombre total d'observations, quelle que soit la façon dont ces observations sont réparties entre les deux groupes.

Remarquez que le test reste valide lorsqu'un des échantillons est réduit à une unique observation (l'autre échantillon devant alors contenir au moins deux observations) : cette observation apporte malgré tout sa contribution à l'estimation aggrégée de la variance.

Dans le cas extrême où un échantillon ne comporte qu'une unique observation et où l'autre échantillon ne comporte que deux observations, la distribution de la statistique du test devient t1, c'est à dire la distribution de Cauchy.

 

Statistique du test

La valeur de la statistique T du test pour les échantillons courants (voir ci-dessus) est affichée.

 

Animation

Cliquez sur "Go" et observez la construction progressive de l'histogramme de la distribution de la statistique du test.

 

 

 

        - Variances inégales

Le calcul de l'estimateur aggrégé de la variance suppose explicitement que les deux populations ont des variances inconnues mais égales. Il n'est pas généralisable au cas où les deux populations ont des variances inégales. En effet, si les deux variances σ1² et σ2² sont estimées séparément, la standardisation de 1 et de 2 conduit à la création de deux variables t indépendantes, mais la distribution de la différence de ces deux variables n'est pas connue.

En  fait, on ne connait pas de test exact permettant de tester l'hypothèse nulle µ1 = µ2 dans cette situation.

Il existe par contre deux tests approximatifs.

 

                * Distribution asymptotique

(2 - 1) est encore normalement distribué, et sa variance est égale à la somme des variances de 1 et de 2, soit σ1²/n1 + σ2²/n2, mais le problème réside dans l'estimation de cette variance.

Puisque la variance empirique S ² est un estimateur convergent de la variance d'une distribution, on peut s'attendre à ce que pour les grandes valeurs de n1 et de n2, la quantité S1²/n1 + S2²/n2 soit proche de la variance de (2 - 1), et donc que la variable T définie par

 

ait une distribution proche d'une distribution normale standard.

On montre effectivement que lorsque n1 et n2 tendent vers l'infini, la variable T converge en distribution vers une variable normale standard. Ce résultat presque intuitif est cependant difficile, et nous l'énonçons sans démonstration.

-----

La variable T est donc une statistique de test asymptotique, que l'on peut utiliser comme statistique de test approximatif pour des échantillons de taille moyenne. Cependant, nous profitons de l'occasion pour rappeler que l'utilisation de résultats asymptotiques pour des échantillons de taille finie est une simple heuristique qui ne bénéficie d'aucune garantie de qualité.

 

                * Approximation de Welch

La variable T ci-dessus ne suit pas une distribution t car nous montrerons que le terme sous le radical du dénominateur n'est pas une variable divisée par son nombre de degrés de liberté, mais est une somme pondérée de variables indépendantes. Nous en déduirons que la variable T suit approximativement une distribution t avec un nombre de degrés de liberté n* qui n'est pas un nombre entier.

Cette approximation s'appelle l'approximation de Welch.

Test t à deux échantillons appariés

Imaginons un groupe de patients soumis à un traitement expérimental, par exemple contre l'hypertension. Avant l'administration du traitement, la pression artérielle de chacun des n patients est mesurée, et ces mesures constituent le premier échantillon. Cette pression est à nouveau mesurée après administration du traitement, et ces nouvelles mesures constituent le deuxième échantillon.

 

 

 

Remarquons que les deux échantillons ont maintenant nécessairement le même nombre n d'observations.

On suppose que la distribution de la pression artérielle dans la population générale est normale de moyenne µ1 et de variance σ². On suppose de plus que si la population était soumise au traitement, la nouvelle distribution de la pression artérielle serait encore normale de variance σ² (pas d'altération de la variance), et de moyenne µ2, possiblement différente de µ1.

Dans le cas des échantillons indépendants, les observations dans les deux échantillons étaient des réalisation des variables normales indépendantes, mais on ne peut maintenant certainement plus faire cette hypothèse. En particulier, on ne peut plus estimer la variance de (2 - 1) par la somme des variances de ces deux v.a. car celles-ci sont corrélées (la valeur de leur coefficient de corrélation est inconnue, mais nous n'en aurons pas besoin). En fait, on suppose que les observations sont issues d'une population normale bivariée, ou binormale.

La différence d = 2 - 1 a cependant une distribution normale, et nous sommes donc en présence d'un échantillon de n observations di = x2i - x1i dont nous voulons savoir si la distribution normale (univariée) dont il est issu est de moyenne nulle.

Nous sommes donc exactement dans le cas précédent d'un test avec un échantillon et valeur de référence (ici, 0), la variance de la distribution normale mère étant inconnue. Nous pouvons donc affirmer que la statistique

 

 

suit la distribution tn - 1 avec n - 1 degrés de liberté.

Généralisation à plus de deux groupes d'observations : ANOVA

Le test t compare les moyennes de deux échantillons, mais il ne se généralise pas à la comparaison des moyennes de trois échantillons ou plus.

Lorsque l'on doit comparer les moyennes de plus de deux échantillons, la première idée est de conduire une série de tests t au niveau de risque α sur toutes les paires d'échantillons, et de penser rejeter l'hypothèse d'égalité de toutes les moyennes au niveau de risque α si au moins une paire d'échantillons rejette l'hypothèse d'égalité de leurs moyenne à ce niveau de risque.

Pour des raisons que nous exposons ici, cette approche n'est pas valide car elle conduit à rejeter l'hypothèse d'égalité des moyennes plus souvent que ce que laisserait supposer le niveau de risque α choisi : la proportion des rejets injustifiés est alors supérieure à α.100%.

La solution correcte est de faire appel au test appelé ANOVA (univariée), plus complexe qu'un test t mais qui permet de tester l'égalité des moyennes d'un nombre quelconque de groupes en respectant le niveau de risque α choisi par l'analyste.

Tests t dans d'autres contextes

Nous avons introduit le test t dans le contexte de la comparaison des moyennes de deux groupes d'observations. Mais le test ne repose que sur le fait que nous avons identifié une statistique dont la distribution était une distribution t de Student. Les conclusions que nous avons tirées quant au rejet de l'hypothèse nulle se retrouveraient dans toute situation dans laquelle la statistique d'un test suit la distribution t.

C'est en particulier le cas lorsque l'on étudie les paramètres estimés {βi}d'une Régression Linéaire (Simple ou Multiple), qui suivent des distribution t. On peut alors tester l'hypothèse βi = 0 pour chacun des paramètres pris individuellement avec un test t, dans un contexte complètement différent de celui évoqué dans cette page.

Test non paramétrique d'identité ; le test de Wilcoxon-Mann-Whitney

Le test t à deux échantillons indépendants fait explicitement appel au fait que les échantillons sont issus de populations normales : c'est un test paramétrique. Malheureusement, il est très sensible aux écarts à la normalité de ces populations, particulièrement quand les échantillons sont de tailles très différentes.

-----

Remarquons que si l'on suppose :

    * La normalité des deux populations,

    * L'égalité de leurs variances,

    * Ainsi que l'égalité de leurs moyennes (H0 : µ1 = µ0),

le test t peut être considéré comme un test d'identité des deux populations dont sont issus les deux échantillons.

Il est alors possible de faire appel à un test d'identité non paramétrique, c'est à dire ne faisant aucune hypothèse sur la nature des deux populations, et supposant seulement l'identité de leurs distributions (hypothèse nulle).

Il est alors possible de faire appel à un test d'identité non paramétrique, c'est à dire ne faisant aucune hypothèse sur la nature des deux populations.

Le plus utilisé des tests non paramétriques testant l'identité de deux populations est le test de (Wilcoxon) Mann-Whitney. Lorsque les populations sont effectivement normales de même variance, le test de Mann-Whitney est légèrement  moins puissant que le test t, mais il lui est bien supérieur dès que les populations s'écartent notablement de la normalité.

Généralisation multivariée, test du T² de Hotelling

La généralisation multivariée de la distribution normale est la distribution normale multivariée (ou multinormale). De même que le test t répondait à la question de savoir si deux distributions normales de même variance avaient des moyennes égales, il est maintenant naturel de se poser la question de savoir si deux distributions multinormales de matrices de covariance identiques, et représentées par deux échantillons multivariés, ont ou non des moyennes identiques. La question est d'importance pour une technique comme l'Analyse Discriminante, qui cherche à affecter des observations à des classes supposées multinormales, le plus souvent de matrices de covariance identiques : si les moyennes des distributions sont effectivement confondues, les classes sont alors confondues, et tout effort de classification est vain.

La question est résolue en calculant la distribution du carré de la distance de Mahalanobis entre les moyennes des échantillons de deux classes supposées superposées (moyennes identiques, matrices de covariance identiques). Ce calcul est difficile et n'est pas donné dans ce Glossaire, mais le résultat est simple, et est donné ici. Le test résultant s'appelle le "test du T² de Hotelling".

____________________________________________________________

 

Rappelons que lorsqu'il est possible de définir un intervalle de confiance pour la valeur empirique d'un paramètre µ d'une distribution, cette valeur empirique est également la statistique d'un test portant sur l'hypothèse nulle H0 : µ = µ0. Par conséquent, tous les calculs relatifs au test t tel que décrit ci-dessus sont identiques à ceux déjà effectués à propos des intervalles de confiance portant sur la moyenne de la distribution normale.

Les Tutoriels ci-dessous sont donc des copies des Tutoriels que vous trouverez à la page portant sur les intervalles de confiance.

 

 

Tutoriel 1

 

Le Tutoriel suivant décrit les méthodes mises en œuvre dans le calcul d'intervalles de confiance exacts pour les moyennes de distributions normales. Nous abordons une seule fois la question de la taille minimale de l'échantillon pour atteindre un niveau de confiance donné pour une longueur donnée de l'intervalle de confiance. Cette question se retrouve à l'identique dans tous les problèmes d'intervalle de confiance.
 

 

INTERVALLES DE CONFIANCES EXACTS

POUR LES MOYENNES DE DISTRIBUTIONS NORMALES

Intervalle de confiance sur une moyenne

Variance connue

L'intervalle

Taille minimale de l'échantillon

Variance inconnue

Différence entre une moyenne et une valeur de référence

Comparaison de deux moyennes

Echantillons appariés

Echantillons indépendants

Variances connues

Variances inconnues mais égales

Variances inconnues et inégales : un échec

TUTORIEL

 __________________________________________________________

 

 

Tutoriel 2

 

Dans le cas le plus général (variances inconnues et inégales), on ne connait pas d'intervalle de confiance exact pour la différence des moyennes de deux distributions normales indépendantes. Mais il est possible de calculer deux types d'intervalles approximatifs :

 

INTERVALLE DE CONFIANCE ASYMPTOTIQUE

ET APPROXIMATION DE WELCH

Intervalle de confiance asymptotique (sans démonstration)

Approximation de Welch

TUTORIEL

 

 

La brièveté de cette table des matières est doublement trompeuse :

 

____________________________________________________________

 

Voir aussi :

Distribution t de Student

ANOVA

Distance de Mahalanobis

Téléchargez ce Glossaire