Exhaustive minimale (Statistique)
Nous avons remarqué qu'en général, la transformée T ' = f(T) d'une statistique exhaustive T par une fonction f(.) n'est pas exhaustive, sauf dans le cas où f(.) est bijective. Mais nous avons également noté que T ' = f(T) peut être exhaustive même si f(.) n'est pas bijective. Dans le vocabulaire du paradigme sur l'information "utile" et l'information "inutile" portée par une statistique, f(.) élimine alors une partie de l'information inutile, tout en retenant la totalité de l'information "utile".

T ' peut alors être perçue comme une version "dégraissée" de T.
La question se pose donc naturellement de savoir s'il existe une limite à la quantité d'information inutile pouvant être retirée d'une statistique exhaustive tout en lui conservant son caractère exhaustif, c'est à dire sans entamer son stock d'information utile
La réponse à cette question est en deux temps :
1) Sous des conditions générales peu contraignantes, on montre qu'il existe effectivement des statistiques exhaustives dite minimales, c'est à dire contenant aussi peu d'information inutile que possible. Toute image par une fonction non bijective d'une telle statistique est alors non exhaustive.
La définition formelle d'une statistique exhaustive minimale est donnée ci-dessous.
2) Il n'est cependant pas garanti qu'une statistique exhaustive minimale ne contienne plus du tout d'information inutile.

Sous certaines conditions générales, l'information inutile peut cependant être totalement éliminée, la statistique exhaustive minimale ne contenant alors plus que l'information utile à l'estimation du paramètre, à l'exclusion de toute information inutile. Ces "super" statistiques exhaustive minimales sont alors appelées "statistiques exhaustive complètes".
Insistons sur le fait qu'une statistique exhaustive minimale peut ne pas être complète, comme nous le montrons ici.
-----
On peut alors visualiser l'ensemble de toutes les statistiques exhaustives pour un paramètre θ comme un "océan" dans lequel :
* La transformation d'une statistique exhaustive par une transformation bijective produit une nouvelle statistique exhaustive se situant à la même "profondeur".
* La transformation d'une statistique exhaustive par une transformation non bijective produisant néanmoins une nouvelle statistique exhaustive nous conduit à une plus grande profondeur.
* Une statistique exhaustive minimale repose sur le fond de l'océan : aucune transformation non bijective de cette statistique ne peut produire une statistique exhaustive. Une statistique exhaustive minimale peut, éventuellement mais pas nécesairement, être complète.

Les considérations ci-dessus pourraient conduire à une définition d'une statistique exhaustive minimale. Cette définition ne serait malheureusement pas opérationnelle, à l'inverse de la définition suivante, universellement retenue :
|
Une statistique exhaustive est dite minimale si elle est fonction de tout autre statistique exhaustive. |
De la définition, on déduit immédiatement que toute transformation bijective d'une statistique exhaustive minimale produit une autre statistique exhaustive minimale. Par ailleurs, nous montrerons que, étant données deux statistiques exhaustives minimales M1 et M2, il existe toujours une transformation bijective entre M1 et M2.
Ainsi, une statistique exhaustive minimale est unique à une bijection près.
La définition d'une statistique exhaustive minimale peut recevoir l'interprétation géométrique suivante.
Dans l'espace à n dimensions engendré par les n variables {x1, x2, ..., xn}, un échantillon X de taille n est représenté par un point. Soit T(X) une statistique, et t un nombre quelconque. L'ensemble At des points représentatifs des échantillons tels que T(X) = t est habituellement un sous-espace de dimension (n - 1) de l'espace des échantillons :

L'espace des échantillons est ainsi partitionné en un ensemble {At} de "feuilles", chaque feuille At correspondant à une valeur de t.
Soit f(.) une fonction non bijective. Sous l'action de f(.), {At} est transformé dans un autre ensemble de feuilles {Bf (t)}. Pour une valeur de t donnée :
* Tous les points de At sont dans le même Bf (t),
* Mais comme f(.) n'est pas bijective, il peut y avoir un autre nombre t' tel que f(t' ) = f(t). Les feuilles At et At' ont alors la même image
Bf (t) = Bf (t' ) sous l'action de f(.).
Soit maintenant T ' une autre statistique définie par T ' = f(T). Elle partitionne l'espace des échantillons en {Bf (t)}, et plusieurs f(At) peuvent être contenus dans le même Bf (t). En conséquence :
La transformée T ' = f(T)
d'une statistique T par une fonction f(.) non bijective
engendre
une partition de l'espace des échantillons plus grossière
que celle engendrée par T.
Donc, par définition, une statistique exhaustive miniamle engendre la partition la plus grossière de toutes les partitions engendrées par des statistiques exhaustives.
De même que la définition d'une statistique exhaustive est difficile à utiliser pour découvrir des statistiques exhaustives, et est avantageusement remplacée dans ce but par le Théorème de Factorisation, la seule définition d'une statistique exhaustive minimale rend la découverte d'une telle statistique très difficile. Heureusement, nous identifierons une condition qui, lorsqu'elle est statistfaite par une statistique T, garantit que cette statistique est exhaustive minimale.
Cette condition s'énonce ainsi :
* Soit p(x, θ) une distribution pour laquelle la valeur de θ est inconnue, et T(X) une statistique que nous n'avons pas besoin de supposer exhaustive.
* Soit également fθ (X) la distribution conjointe de l'échantillon.
* Soient enfin les deux conditions suivantes :
1) Pour deux échantillons X et Y tels que T(X) = T(Y) (et qui appartiennent donc à la même "feuille" dans l'illustration ci-dessus), le rapport
fθ (X) / fθ (Y)
considéré comme une fonction de θ ne dépend en fait pas de θ.
2) Inversement, si deux échantillons X et Y sont tels que fθ (X) / fθ (Y) ne dépend pas de θ, alors T(X) = T(Y).
Nous montrerons que
|
Ce résultat est parfois appelé "Condition de Lehmann-Scheffé", voire "Théorème de Lehmann-Scheffé pour les statistiques exhaustive minimales", malgré le risque de confusion avec le Théorème de Lehmann-Scheffé (voir ici).
____________________________________________________________________
|
Tutoriel |
Dans ce Tutoriel, nous commençons par montrer que, lorsqu'elle existe, une statistique exhaustive minimale est unique à une bijection près.
Puis nous établissons la condition classique garantissant qu'une statistique est exhaustive minimale.
Nous passons ensuite en revue les statistiques exhaustives précédemment identifiées et montrons qu'elles sont en fait exhaustives minimales.
Le cas de la distribution uniforme U[θ, θ + 1] montrera que la dimension d'une statistique exhaustive minimale peut être différente de celle du paramètre à estimer.
STATISTIQUE EXHAUSTIVE MINIMALE
|
Unicité d'une statistique exhaustive minimale Condition pour qu'une statistique soit exhaustive minimale La statistique est exhaustive La statistique est exhaustive minimale Exemples Distribution de Bernoulli Distribution uniforme [0, θ ] Distribution uniforme [θ, θ + 1] Distribution de Poisson Distribution normale Moyenne Variance Moyenne et variance Distribution exponentielle Distribution Gamma Paramètre de forme Paramètre de dispersion Paramètres de forme et de dispersion Distribution Beta |
||
|
TUTORIAL |
||
_____________________________________________________
Voir aussi :