|
Animation interactive |
t (Test)
L'expression "test t (de Student)" recouvre en fait plusieurs tests d'inspiration commune, et qui portent sur la crédibilité :
* De la valeur de la moyenne empirique d'un échantillon issu d'une population normale comme estimation de la valeur de la moyenne (inconnue) de cette population (test t à un échantillon).
* De la valeur de la différence des moyennes empiriques de deux échantillons issus de deux populations normales comme estimation de la différence des moyennes de ces deux populations (test t à deux échantillons).
L'échantillon suivant est issu d'une population normale réputée avoir pour moyenne la valeur µ0. Il pourra s'agir, par exemple, des diamètres mesurés d'un certain nombre de pièces mécaniques usinées par une machine réglée pour produire des pièces de diamètre µ0.

La moyenne des valeurs des observations de l'échantillon
est égale à
, qui est légèrement différent
de µ0. Cette différence
est-elle significative ? Autrement dit, la différence entre
et µ0 est-elle tellement
importante qu'elle contredit clairement l'affirmation selon laquelle la moyenne
de la population normale est effectivement µ0 (machine
bien réglée) ?
Dans le vocabulaire des tests, il s'agit donc de tester :
* L'hypothèse nulle H0 : µ = µ0, où µ est la vraie valeur de la moyenne de la population normale, et où µ0 porte alors le nom de "valeur de référence",
* Contre l'hypothèse alternative H1 : µ ≠ µ0.
-----
Plus grande est la valeur absolue
de la différence (
- µ0),
plus nous serons enclins à rejeter l'hypothèse nulle au profit
de l'hypothèse alternative, et (
- µ0)
apparaît donc comme une statistique de test plausible : c'est une variable
normale centrée (lorsque H0 est
vraie) de variance σ²/n. Cependant, elle n'est
pas utilisable en l'état car sa distribution, lorsque H0 est
vraie, dépend de la variance σ² de la population mère.
Deux situations se présentent alors :
Si la variance σ² est connue, il suffit
de standardiser (
- µ0)
en la divisant par son propre écart-type pour obtenir une variable normale standard
N(0, 1), et donc dont la distribution ne dépend
pas de σ² :

où n est la taille de l'échantillon.
* Test bilatéral
L'hypothèse nulle est alors rejetée au niveau de risque α si la valeur de z est supérieure à zα/2 où inférieure à -zα/2, où zα/2 est la valeur pour laquelle l'aire sous la gaussienne standard à la droite de zα/2 est égale à α/2.

* Test unilatéral
L'hypothèse alternative peut être plus restrictive que la seule H1 : µ ≠ µ0. Par exemple, l'hypothèse H1 : µ > µ0 énonce que, non seulement la moyenne µ est différente de µ0, mais plus précisément qu'elle est supérieure à µ0. Il est alors naturel de rejeter l'hypothèse nulle en faveur de l'hypothèse alternative si la valeur de z est largement supérieure à 0, un argument en faveur d'une valeur de µ supérieure à µ0.
La région critique est alors définie par :
z > zα

La variance de la population est malheureusement le plus souvent inconnue, et l'expression de z ci-dessus n'est alors plus utilisable puisqu'elle contient σ.
Nous sommes exactement dans la situation qui nous a amenés à définir la distribution t de Student. Nous pouvons donc affirmer que la statistique Tn obtenue en remplaçant dans l'expression de z l'écart-type vrai σ par :

suit la distribution tn - 1 à (n - 1) degrés de liberté.
|
Tn ~ tn - 1 |
Le test se conduit alors exactement comme dans le cas où la variance est connue, la distribution normale standard de la statistique z devant simplement être remplacée par la distribution tn - 1 de la statistique Tn.
Nous venons de concevoir un test relatif à l'égalité d'une moyenne et d'une valeur de référence fixe.
Nous abordons maintenant la généralisation de cette question à la comparaison des moyennes de deux populations normales. Il est présumé que ces deux populations ont la même moyenne (H0 : µ1 = µ2 ), et la question est de savoir si la différence entre les moyennes des deux échantillons est suffisamment importante pour contredire cette hypothèse (H1 : µ1 ≠ µ2 ).
On distingue deux cas : échantillons indépendants et échantillons appariés.
On dispose de deux lots de pièces mécaniques de conceptions identiques.
* Le premier lot contient n1 pièces usinées par une première machine M1 réglée pour produire des pièces de diamètre µ1.
* Le deuxième lot contient n2 pièces usinées par une deuxième machine M2 réglée pour produire des pièces de même diamètre µ1. Cependant, on ne peut écarter la possibilité que cette deuxième machine ait un réglage légèrement différent de celui de la première, et on considèrera donc que les pièces usinées par M2 ont en moyenne un diamètre µ2, dont on pense qu'il est égal à µ1.
On mesure les diamètres des pièces des
deux lots, et les moyennes de ces deux séries de mesures sont notées
respectivement
1
et
2.

La question est de savoir si la différence
(
2
-
1)
est suffisamment importante pour contredire l'hypothèse selon laquelle
les deux machines ont des réglages identiques, et donc que µ1
= µ2.
A nouveau, nous utiliserons (
2
-
1)
comme point de départ de la construction de la statistique de test. Les
deux populations étant normales et indépendantes, (
2
-
1)
a une distribution normale, centrée si effectivement µ1
= µ2 (H0 vraie).
* Variances connues
Si les variances σ1² et σ2² des
deux populations sont connues, la variance de (
2
-
1)
est connue car :
-
1 a
pour variance σ1² / n1.
-
2 a
pour variance σ2² / n2.
-
(
2
-
1)
a donc pour variance σ1² / n1 + σ2² /
n2.
et nous sommes ramenés au cas d'un échantillon avec valeur de référence (ici, 0).
* Variances inconnues
Si les variances sont inconnues, il faut distinguer le cas où les variances sont supposées égales de celui où ne formule pas cette hypothèse supplémentaire.
- Variances égales
On suppose que les deux populations normales sont de même variance σ², mais que la valeur de cette variance est inconnue. Il nous faut donc identifier un estimateur de la variance.
Nous montrerons que la quantité

appelée "estimateur aggrégé de la variance", est un estimateur sans biais de la variance commune σ².
Nous en déduirons que la statistique
|
|
suit la distribution tn1 + n2 - 2 , qui ne dépend pas de σ, et qui est donc utilisable comme statistique de test.
Tout se passe alors comme pour le test à un échantillon : l'hypothèse nulle est rejetée en faveur de l'hypothèse alternative si la valeur de T est dans la région critique définie par la valeur choisie pour le niveau de risque α.
Cette animation illustre le test t à deux échantillons indépendants avec variances inconnues mais égales.
|
Cadre supérieur
Cadre inférieur
Animation
|
- Variances inégales
Le calcul de l'estimateur aggrégé de
la variance suppose explicitement
que les deux populations ont des variances inconnues mais égales. Il
n'est pas généralisable au cas où les deux populations
ont des variances inégales. En effet, si les deux variances σ1² et
σ2² sont estimées séparément,
la standardisation de
1 et
de
2 conduit
à la création de deux variables t indépendantes,
mais la distribution de la différence de ces deux variables n'est
pas connue.
En fait, on ne connait pas de test exact permettant de tester l'hypothèse nulle µ1 = µ2 dans cette situation.
Il existe par contre deux tests approximatifs.
* Distribution asymptotique
(
2
-
1)
est encore normalement distribué, et sa variance est égale à
la somme des variances de
1 et
de
2,
soit σ1²/n1 + σ2²/n2,
mais le problème réside dans l'estimation de cette variance.
Puisque la variance empirique S ² est
un estimateur convergent de la variance d'une distribution, on peut s'attendre
à ce que pour les grandes valeurs de n1 et de n2,
la quantité S1²/n1 + S2²/n2 soit
proche de la variance de (
2
-
1),
et donc que la variable T définie par

ait une distribution proche d'une distribution normale standard.
On montre effectivement que lorsque n1 et n2 tendent vers l'infini, la variable T converge en distribution vers une variable normale standard. Ce résultat presque intuitif est cependant difficile, et nous l'énonçons sans démonstration.
-----
La variable T est donc une statistique de test asymptotique, que l'on peut utiliser comme statistique de test approximatif pour des échantillons de taille moyenne. Cependant, nous profitons de l'occasion pour rappeler que l'utilisation de résultats asymptotiques pour des échantillons de taille finie est une simple heuristique qui ne bénéficie d'aucune garantie de qualité.
* Approximation de Welch
La variable T ci-dessus ne suit pas une distribution
t car nous montrerons que le terme sous le radical du dénominateur
n'est pas une variable
divisée par son nombre de degrés de liberté, mais est une
somme pondérée de variables
indépendantes. Nous en déduirons que la variable T suit
approximativement une distribution t avec un nombre de degrés
de liberté n* qui n'est pas un nombre entier.
Cette approximation s'appelle l'approximation de Welch.
Imaginons un groupe de patients soumis à un traitement expérimental, par exemple contre l'hypertension. Avant l'administration du traitement, la pression artérielle de chacun des n patients est mesurée, et ces mesures constituent le premier échantillon. Cette pression est à nouveau mesurée après administration du traitement, et ces nouvelles mesures constituent le deuxième échantillon.

Remarquons que les deux échantillons ont maintenant nécessairement le même nombre n d'observations.
On suppose que la distribution de la pression artérielle dans la population générale est normale de moyenne µ1 et de variance σ². On suppose de plus que si la population était soumise au traitement, la nouvelle distribution de la pression artérielle serait encore normale de variance σ² (pas d'altération de la variance), et de moyenne µ2, possiblement différente de µ1.
Dans le cas des échantillons indépendants, les observations dans les deux échantillons étaient
des réalisation des variables normales indépendantes, mais on ne peut
maintenant certainement plus faire cette hypothèse. En particulier,
on ne peut plus estimer la variance de (
2
-
1)
par la somme des variances de ces deux v.a. car celles-ci sont corrélées
(la valeur de leur coefficient de corrélation est inconnue, mais nous
n'en aurons pas besoin). En fait, on suppose que les observations
sont issues d'une population normale bivariée, ou binormale.
La différence d =
2
-
1 a cependant
une distribution normale, et nous sommes donc en présence d'un échantillon
de n observations di = x2i
- x1i dont nous voulons savoir si la distribution
normale (univariée) dont il est issu est de moyenne nulle.
Nous sommes donc exactement dans le cas précédent d'un test avec un échantillon et valeur de référence (ici, 0), la variance de la distribution normale mère étant inconnue. Nous pouvons donc affirmer que la statistique
suit la distribution tn - 1 avec n - 1 degrés de liberté.
Le test t compare les moyennes de deux échantillons, mais il ne se généralise pas à la comparaison des moyennes de trois échantillons ou plus.
Lorsque l'on doit comparer les moyennes de plus de deux échantillons, la première idée est de conduire une série de tests t au niveau de risque α sur toutes les paires d'échantillons, et de penser rejeter l'hypothèse d'égalité de toutes les moyennes au niveau de risque α si au moins une paire d'échantillons rejette l'hypothèse d'égalité de leurs moyenne à ce niveau de risque.
Pour des raisons que nous exposons ici, cette approche n'est pas valide car elle conduit à rejeter l'hypothèse d'égalité des moyennes plus souvent que ce que laisserait supposer le niveau de risque α choisi : la proportion des rejets injustifiés est alors supérieure à α.100%.
La solution correcte est de faire appel au test appelé ANOVA (univariée), plus complexe qu'un test t mais qui permet de tester l'égalité des moyennes d'un nombre quelconque de groupes en respectant le niveau de risque α choisi par l'analyste.
Nous avons introduit le test t dans le contexte de la comparaison des moyennes de deux groupes d'observations. Mais le test ne repose que sur le fait que nous avons identifié une statistique dont la distribution était une distribution t de Student. Les conclusions que nous avons tirées quant au rejet de l'hypothèse nulle se retrouveraient dans toute situation dans laquelle la statistique d'un test suit la distribution t.
C'est en particulier le cas lorsque l'on étudie les paramètres estimés {βi}d'une Régression Linéaire (Simple ou Multiple), qui suivent des distribution t. On peut alors tester l'hypothèse βi = 0 pour chacun des paramètres pris individuellement avec un test t, dans un contexte complètement différent de celui évoqué dans cette page.
Le test t à deux échantillons indépendants fait explicitement appel au fait que les échantillons sont issus de populations normales : c'est un test paramétrique. Malheureusement, il est très sensible aux écarts à la normalité de ces populations, particulièrement quand les échantillons sont de tailles très différentes.
-----
Remarquons que si l'on suppose :
* La normalité des deux populations,
* L'égalité de leurs variances,
* Ainsi que l'égalité de leurs moyennes (H0 : µ1 = µ0),
le test t peut être considéré comme un test d'identité des deux populations dont sont issus les deux échantillons.
Il est alors possible de faire appel à un test d'identité non paramétrique, c'est à dire ne faisant aucune hypothèse sur la nature des deux populations, et supposant seulement l'identité de leurs distributions (hypothèse nulle).
Il est alors possible de faire appel à un test d'identité non paramétrique, c'est à dire ne faisant aucune hypothèse sur la nature des deux populations.
Le plus utilisé des tests non paramétriques testant l'identité de deux populations est le test de (Wilcoxon) Mann-Whitney. Lorsque les populations sont effectivement normales de même variance, le test de Mann-Whitney est légèrement moins puissant que le test t, mais il lui est bien supérieur dès que les populations s'écartent notablement de la normalité.
La généralisation multivariée de la distribution normale est la distribution normale multivariée (ou multinormale). De même que le test t répondait à la question de savoir si deux distributions normales de même variance avaient des moyennes égales, il est maintenant naturel de se poser la question de savoir si deux distributions multinormales de matrices de covariance identiques, et représentées par deux échantillons multivariés, ont ou non des moyennes identiques. La question est d'importance pour une technique comme l'Analyse Discriminante, qui cherche à affecter des observations à des classes supposées multinormales, le plus souvent de matrices de covariance identiques : si les moyennes des distributions sont effectivement confondues, les classes sont alors confondues, et tout effort de classification est vain.
La question est résolue en calculant la distribution du carré de la distance de Mahalanobis entre les moyennes des échantillons de deux classes supposées superposées (moyennes identiques, matrices de covariance identiques). Ce calcul est difficile et n'est pas donné dans ce Glossaire, mais le résultat est simple, et est donné ici. Le test résultant s'appelle le "test du T² de Hotelling".
____________________________________________________________
Rappelons que lorsqu'il est possible de définir un intervalle de confiance pour la valeur empirique d'un paramètre µ d'une distribution, cette valeur empirique est également la statistique d'un test portant sur l'hypothèse nulle H0 : µ = µ0. Par conséquent, tous les calculs relatifs au test t tel que décrit ci-dessus sont identiques à ceux déjà effectués à propos des intervalles de confiance portant sur la moyenne de la distribution normale.
Les Tutoriels ci-dessous sont donc des copies des Tutoriels que vous trouverez à la page portant sur les intervalles de confiance.
|
Tutoriel 1 |
Le Tutoriel suivant décrit les méthodes mises
en œuvre dans le calcul d'intervalles de confiance exacts pour les moyennes
de distributions normales. Nous abordons une seule fois la question de la taille
minimale de l'échantillon pour atteindre un niveau de confiance donné pour une
longueur donnée de l'intervalle de confiance. Cette question se retrouve à
l'identique dans tous les problèmes d'intervalle de confiance.
INTERVALLES DE CONFIANCES EXACTS
POUR LES MOYENNES DE DISTRIBUTIONS NORMALES
|
Intervalle de confiance sur une moyenne Variance connue L'intervalle Taille minimale de l'échantillon Variance inconnue Différence entre une moyenne et une valeur de référence Comparaison de deux moyennes Echantillons appariés Echantillons indépendants Variances connues Variances inconnues mais égales Variances inconnues et inégales : un échec |
||
|
TUTORIEL |
||
__________________________________________________________
|
Tutoriel 2 |
Dans le cas le plus général (variances inconnues et inégales), on ne connait pas d'intervalle de confiance exact pour la différence des moyennes de deux distributions normales indépendantes. Mais il est possible de calculer deux types d'intervalles approximatifs :
INTERVALLE DE CONFIANCE ASYMPTOTIQUE
ET APPROXIMATION DE WELCH
|
Intervalle de confiance asymptotique (sans démonstration) Approximation de Welch |
||
|
TUTORIEL |
||
La brièveté de cette table des matières est doublement trompeuse :
____________________________________________________________
Voir aussi :