Estimation (par intervalle)
Si vous n'êtes pas familarisé avec la notion d'estimation, nous vous suggérons de lire dans un premier temps l'entrée relative à l'estimation ponctuelle.
Etant donné un échantillon de taille
n issu d'une distribution f(x, θ),
un estimateur "ponctuel" θ* du paramètre θ produit
un nombre θ*, l'estimation de la valeur θ0
du paramètre θ de la distribution. Si cet estimateur possède les propriétés attendues
d'un bon estimateur, l'estimation θ* est
notre meilleur pari sur la valeur vraie θ0 du
paramètre θ. Cependant, θ* n'est
qu'un nombre "nu", sans aucune information sur sa proximité avec θ0. Tout
ce que nous savons est que, en termes vagues, θ* n'est
probablement pas très éloigné de θ0,
mais cette intuition n'est supportée par aucune information numérique sur les
termes "probablement " et "éloigné". Par exemple,
la moyenne de l'échantillon
a
toutes les vertus que l'on peut attendre d'un bon estimateur de la moyenne µ
d'une distribution. Pourtant, la connaissance de la moyenne de l'échantillon
ne donne par elle-même aucune information sur sa distance à la
moyenne µ.
Nous voudrions donc une procédure qui nous permette de savoir, en termes probabilistes, où se trouve la valeur θ0 du paramètre θ. C'est l'objectif que se fixe l'estimation par intervalle.
Plus précisément, étant donné un échantillon, nous voulons identifier un intervalle sur la droite des valeurs du paramètre :
* Dont les extrémités soient déterminées uniquement par l'échantillon (et qui soient donc des v.a., et plus précisément, des statistiques),
* Et tel que l'on puisse affirmer :
"La probabilité pour que cet intervalle recouvre la vraie valeur θ0 est égale à P."
où P est une probabilité arbitrairement fixée par l'analyste (en général, 0,90 ou 0,95).
Cette phrase mérite quelques explications. Supposons que nous sachions construire un tel segment. Nous tirons alors un grand nombre de n-échantillons. Pour chaque échantillon, un nouvel intervalle est construit par notre procédure. Alors, dans 100.P% des cas, cet intervalle recouvrira θ0.
Pour un échantillon donné, nous aurons donc identifié une région limitée qui recouvre θ0 avec la probabilité P. Si P est grand (disons, 0,95), nous avons identifié une région qui recouvre presque certainement θ0.
Remarquez que nous avons résisté à la tentation de dire
"La probabilité pour que θ0 soit
dans l'intervalle est P". En effet, θ0 est
inconnu, mais n'est pas une variable aléatoire : seul l'intervalle est
aléatoire.
Un intervalle tel que décrit ci-dessus, lorsqu'il peut être identifié, s'appelle un intervalle de confiance, et la probabilité P s'appelle le niveau de confiance associé à cet intervalle de confiance.
Remarquons que la construction d'un intervalle de confiance
ne requiert pas, en principe, de procéder dans un premier temps à
une estimation ponctuelle du paramètre.
La définition générale d'un estimateur ponctuel est "Une fonction quelconque de l'échantillon (càd une "statistique"). Qu'une statistique particulière présente un intérêt dans le but d'estimer la valeur d'un paramètre dépend de ses propriétés (p.ex. convergence, absence de biais, Erreur Quadratique Moyenne).
De même, la définition générale d'un intervalle de confiance est :
* Une paire de fonctions G(x) et D(x) ne dépendant que de l'échantillon,
* Telles que l'on ait toujours G(x) < D(x).
Que la paire de fonctions [G(x), D(x)] présente un intérêt dans le but de localiser la valeur θ0 du paramètre dépend :
* De la possibilité d'affecter une probabilité de recouvrement de θ0 (niveau de confiance) pour chaque échantillon x,
* Du fait que les intervalles [G(x), D(x)] restent raisonnablement courts (voir ci-dessous) pour des niveaux de confiance élevés.
La définition du "niveau de confiance" donnée ci-dessus suppose que l'on soit dans la circonstance particulièrement favorable où il est possible d'affecter, à un intervalle donné, une probabilité de recouvrement de la valeur θ0 du paramètre. En particulier, ceci suppose que cette probabilité ait la même valeur quelle que soit la valeur de θ0.
Il arrive fréquemment que l'on soit dans la situtation moins favorable suivante : pour une valeur θ0 donnée, il existe bien une probabilité Pθ de recouvrement de θ0 par l'intervalle, mais cette probabilité dépend de θ0 (qui est bien sûr inconnu), et ne peut donc être calculée. La notion de "niveau de confiance" perd alors son sens.
Cependant, il est alors parfois possible de calculer la plus petite valeur P que prend la probabilité Pθ sur l'ensemble du domaine de θ :
P = inf {Pθ sur le domaine de θ}
Au vu d'un échantillon, on peut alors construire un intervalle et affirmer que la probabilité pour que cet intervalle recouvre θ0 est au moins égale à P.
Nous décrivons ci-dessous ce qui est peut-être le plus simple des intervalles de confiance : celui portant sur l'estimation de la moyenne d'une distribution normale.
Soit N(µ, σ²) une distribution normale (courbe rouge de l'illustration ci-dessous), dont un n-échantillon est tiré. La variance σ² est supposée connue, mais pas la moyenne µ. Nous utilisons la moyenne de l'échantillon m comme estimateur de la moyenne µ de la distribution. Elle a la distribution N(µ, σ²/n) (courbe bleue).
La distribution de m peut être changée en une distribution normale standard (moyenne nulle, variance unité) par la transformation T :

Nous avons m'~N(0, 1) (courbe noire).

Plaçons deux points G' et D' sur cette distribution normale standard de telle façon que l'aire sous chacune des ailes de la gaussienne soit, disons, 0,025 (régions rouges). La transformation inverse de T transforme ces points en G et D. La moyenne m a la probabilité 0,95 d'être en dehors des régions rouges, et il en est de même pour m'.
Plus généralement, si on note la probabilité P (arbitrairement choisie par l'analyste) par 1 - α, alors :

où zα /2 est l'abscisse telle que l'aire sous la gaussienne standard à droite de zα /2 soit égale à α /2.
Par la transformation inverse de T, on a :

Cette expression est équivalente à la suivante :

-----
Ces deux expressions sont équivalentes mais ont des interprétations différentes
:
* La première expression est la probabilité pour que la v.a. m soit à l'intérieur d'un intervalle fixe, centré sur µ, et de longueur 2(.zα /2 .σ.n-1/2 ).
* La deuxième expression est la probabilité pour qu'un certain intervalle aléatoire centré sur m, lui aussi de longueur 2(.zα /2 .σ.n-1/2 ), recouvre µ.

Il apparait donc que nous avons trouvé un intervalle (aléatoire) :
* Dont les extrémités ne dépendent que de l'échantillon,
* Et qui recouvre la moyenne µ de la distribution avec une probabilité donnée P = 1 - α,
ce qui est exactement ce que nous recherchions.
L'intervalle s'appelle l'intervalle de confiance associé à m (segment vert dans l'illustration ci-dessus) pour le niveau de confiance 1 - α.
La longueur de l'intervalle de confiance, 2(.zα /2 .σ.n-1/2 ), est proportionnelle à l'écart-type de la distribution, et donc à l'écart-type de la distribution de m, l'estimation de µ. On peut donc dire que :
* L'estimation ponctuelle porte sur la tendance centrale de la distribution de l'estimateur paramètre.
* L'estimation par intervalle porte à la fois sur la tendance centrale et sur l'étendue de la distribution de l'estimateur du paramètre.
-----
On remarquera que dans ce cas particulier très simple, la longueur de l'intervalle de confiance ne dépend de l'échantillon que par l'intermédiaire de la taille n de cet échantillon. Pour un niveau de confiance donné, on peut donc calculer le nombre d'observations à collecter de façon à ce que les intervalles de confiance aient une longueur donnée. Inversement, si le nombre d'observations est imposé (par des limites pratiques de temps ou de budget), la longueur des intervalles de confiance est imposée par le niveau de confiance choisi.
Dans l'exemple ci-dessus, ce qui a rendu facile l'identification d'intervalles de confiance est la découverte d'une grandeur

dont la distribution ne dépend pas de µ.
Plus généralement, on appelle "fonction pivotale", ou pivot, une quantité dont la distribution ne dépend pas de la valeur du paramètre considéré. Notons qu'un pivot n'est pas une statistique parce que sa définition ne dépend pas seulement des observations dans l'échantillon, mais également de la valeur θ0 du paramètre (ici, µ).
Tout pivot :
* Ne dépendant que d'un seul paramètre,
* Et dont la distribution est connue,
peut être utilisé pour construire un intervalle de confiance pour ce paramètre. Toute paire de nombres G' et D' définit deux "régions d'exclusion" (les régions rouges de l'exemple ci-dessus) sous la courbe de la distribution du pivot. La somme des aires de ces deux régions est un nombre α, et le même argument que précédemment montre que les transformés inverses de G' et D' , soit G et D, définissent un intervalle de confiance au niveau de confiance 1 - α.
Lorsqu'il existe une procédure permettant d'associer une probabilité de recouvrement (niveau de confiance) à un intervalle, les trois grandeurs :
1) Niveau de confiance,
2) Longueur de l'intervalle de confiance,
3) Et taille de l'échantillon
Nous avons mentionné que la valeur du niveau de confiance était en général fixée a priori. Pour un échantillon donné, si l'analyste décide d'augmenter la valeur du niveau de confiance, il en résultera une augmentation de la longueur de l'intervalle de confiance. En effet, pour augmenter la probabilité pour que la valeur vraie du paramètre soit recouverte par l'intervalle, il faut nécessairement allonger celui-ci, et donc augmenter l'incertitude avec laquelle est localisée cette vraie valeur.
A l'inverse, réduire la longueur de l'intervalle de confiance ne peut être obtenu qu'au prix d'une diminution du niveau de confiance : plus petit est l'intervalle, moins grande est la probabilité pour qu'il recouvre la valeur du paramètre (image inférieure de l'illustration ci-dessous) :
Lorsque l'on fait tendre vers 0 le niveau de confiance,
la longueur de l'intervalle de confiance tend également vers 0. Ses deux
extrémités convergent alors vers une limite commune que l'on
appelle l'estimateur (ponctuel) de Hodges-Lehmann du paramètre
θ.
Bien que le principe de l'estimation par intervalle n'exige pas une estimation ponctuelle préalable, nous verrons que la plupart des intervalles de confiance classiques sont obtenus en "coiffant" une estimation ponctuelle θ* par un intervalle dont le milieu est cette estimation ponctuelle. Un intervalle de confiance se présente alors sous la forme
θ* ± Δ
et la longueur de l'intervalle de confiance est alors 2Δ.
Δ dépend du niveau de confiance (voir ci-dessus), mais il dépend aussi de la taille de l'échantillon pour un niveau de confiance donné. Plus précisément, il diminue lorsque la taille de l'échantillon augmente. Ceci n'est pas surprenant : plus grand est le nombre d'observations dont on dispose, et plus grande est la précision avec laquelle la valeur de θ* est connue, et donc plus court est l'intervalle de confiance.
De même, si l'on impose aux intervalles de confiance d'avoir une longueur donnée, le niveau de confiance tend à augmenter lorsque la taille des échantillons augmente. Dans les cas favorables (voir ci-dessous), il est alors possible de calculer quel doit être le nombre d'observations collectées (taille de l'échantillon) de façon à obtenir des estimations qui aient à la fois un niveau de confiance donné et une longueur d'intervalle de confiance donnée.
Il existe en général une infinité d'intervalles de confiance (paires [G(x), D(x)]) conduisant à un même niveau de confiance pour tout échantillon x.
Reprenons l'exemple de l'estimation par intervalle de la moyenne de la distribution normale. Toute paire de points (G, D) telle que la somme des aires (rouges) sous les ailes de la distribution du pivot soit égale à α définit un intervalle de confiance au niveau de confiance 1 - α (image inférieure de l'illustration ci-dessous).
Nous avons choisi arbitrairement la solution "symétrique" pour des raisons de simplicité. Cependant, l'objectif recherché par l'estimation par intervalle étant de localiser le plus précisément possible la valeur θ0 du paramètre, il est souhaitable, pour un niveau de confiance donné, d'identifier parmi tous les intervalles de confiance possibles celui ayant la plus petite longueur.
On peut montrer que dans le cas où la distribution de l'estimateur θ* est unimodale et symétrique, alors l'intervalle obtenu en éliminant dans chacune des deux ailes de la distribution une aire égale à α/2 est bien l'intervalle le plus court pour le niveau de confiance 1 - α choisi.
Dans des situations plus générales, cette stratégie ne conduit pas nécessairement à l'intervalle de confiance le plus court.
-----
Lorsqu'il n'est pas possible d'identifier clairement l'intervalle de confiance le plus court, on peut parfois se rabattre sur une stratégie de rechange qui consiste à identifier un intervalle (càd une paire de fonctions [G(x), D(x)]) conduisant à la plus petite longueur moyenne.
-----
Enfin, une autre solution de rechange, lorsqu'un pivot est disponible, consiste à définir un intervalle de confiance en choisissant une paire de fonctions [G(x), D(x)] conduisant non pas à minimiser la longueur de l'intervalle de confiance, mais la longueur de son image dans l'espace du pivot (voir ici).
________
Dans les problèmes simples, comme celui de la définition d'un intervalle de confiance pour la moyenne de la distribution normale, ces trois définition sont équivalentes, mais ce n'est pas toujours le cas pour des situations plus complexes.
Il arrive souvent qu'on ne connaisse aucun pivot pour un paramètre donné, mais que l'on parvienne à identifier des pivots permettant la construction d'intervalles de confiance approximatifs.
Il est parfois possible de définir une quantité qui, bien que n'étant pas un pivot (parce que dépendant du paramètre à estimer), a une distribution qui tend, pour de grands échantillons, vers une distribution qui ne dépend plus de ce paramètre. On utilise alors cette distribution pour construire un intervalle de confiance qui, bien que non exact, donne des intervalles de confiance de plus au plus précis quand la taille de l'échantillon tend vers l'infini.
Il est également parfois possible de trouver une quantité pivotale qui ne soit pas construite à partir de l'estimateur, mais dont on puisse montrer qu'elle est une bonne approximation de cet estimateur. On peut alors l'utiliser pour construire un intervalle de confiance approximatif.
L'exemple le plus connu de ce type de situation est l'approximation de Welch (voir ci-dessous), qui sert à construire un intervalle de confiance approximatif pour la différence des moyennes de deux distributions normales quand les variances de ces distributions sont inconnues et inégales.
Les intervalles de confiance jouent un rôle central en modélisation.
* Ils permettent de quantifier l'incertitude portant sur la valeur des paramètre d'un modèle ajusté (qui sont des estimations ponctuelles), par exemple en Régression Linéaire.
* De même, ils permettent de quantifier l'incertitude portant sur les prédictions d'un modèle prédictif. Dans le cas de la régression, cette incertitude se traduit par un "ruban de confiance" encadrant la courbe des prédictions du modèle (image inférieure de l'illustration ci-dessous) :
On constate que la densité des observations joue un rôle central dans la largeur du ruban de confiance, celui-ci tendant à se resserer dans les régions à forte densité, et à s'élargir dans les régions de faible densité.
____________________________________________________________
Avertissement : les Tutoriels décrits
ci-dessous sont les mêmes que ceux décrits à la page "Intervalle
de confiance".
|
Tutoriel 1 |
Le Tutoriel suivant décrit les méthodes mises
en œuvre dans le calcul d'intervalles de confiance exacts pour les moyennes
de distributions normales. Nous abordons une seule fois la question de la taille
minimale de l'échantillon pour atteindre un niveau de confiance donné pour une
longueur donnée de l'intervalle de confiance. Cette question se retrouve à
l'identique dans tous les problèmes d'intervalle de confiance.
INTERVALLES DE CONFIANCES EXACTS
POUR LES MOYENNES DE DISTRIBUTIONS NORMALES
|
Intervalle de confiance sur une moyenne Variance connue L'intervalle Taille minimale de l'échantillon Variance inconnue Différence entre une moyenne et une valeur de référence Comparaison de deux moyennes Echantillons appariés Echantillons indépendants Variances connues Variances inconnues mais égales Variances inconnues et inégales : un échec |
||
|
TUTORIEL |
||
____________________________________________________________
|
Tutoriel 2 |
Dans le cas le plus général (variances inconnues et inégales), on ne connait pas d'intervalle de confiance exact pour la différence des moyennes de deux distributions normales indépendantes. Mais il est possible de calculer deux types d'intervalles approximatifs :
INTERVALLE DE CONFIANCE ASYMPTOTIQUE
ET APPROXIMATION DE WELCH
|
Intervalle de confiance asymptotique (sans démonstration) Approximation de Welch |
||
|
TUTORIEL |
||
La brièveté de cette table des matières est doublement trompeuse :
___________________________________________________
Voir aussi :