Exhaustive complète  (Statistique)

Soit p(x, θ) une distribution de probabilité dont on cherche à estimer la valeur du paramètre θ à partir d'un échantillon X.

    * Une statistique exhaustive T(X) contient toute l'information relative au paramètre θ disponible dans l'échantillon. En termes informels, on dit que T(X) contient toute l'information utile à l'estimation de θ, plus une certaine quantité d'information inutile pour cette tâche.

    * En général, une statistique T ' fonction non bijective d'une statistique exhaustive T n'est pas exhaustive. Mais il peut arriver qu'elle le soit, auquel cas elle contient encore toute l'information utile sur θ, et s'est en plus débarassée d'une certaine quantité de l'information inutile contenue dans T. Si une statistique exhaustive ne peut plus être transformée en une autre statistique exhaustive "plus légère" par une transformation non bijective, on dit que cette statistique est exhaustive minimale.

    * Une statistique exhaustive minimale peut encore contenir une certaine quantité d'information inutile, dont il n'est alors pas possible de se débarasser sans perdre la nature exhaustive de la statistique.

 

 

Mais il peut également arriver qu'une exhaustive statistique minimale se soit débarassée de l'intégralité de l'information inutile, et qu'elle ne contienne plus que l'information utile à l'estimation de θ. Une telle statistique est alors dite "exhaustive complète", ou simplement "complète" (image inférieure de l'illustration ci-dessus).

Définition d'une statistique exhaustive complète

Cette idée intuitive est assez difficile à formaliser. Nous le ferons en rappelant que le théorème de de Rao-Blackwell permet de réduire la variance d'un estimateur sans biais par conditionnement sur une statistique exhaustive, mais sans garantie sur le fait que l'estimateur (sans biais) résultant de cette "blackwellisation" soit de variance minimale. Une statistique exhaustive complète étant le nec plus ultra des statistiques exhaustives, on peut espérer que la blackwellisation d'un estimateur sans biais par une statistique complète produise à son tour le nec plus ultra des estimateurs sans biais, à savoir un Estimateur Sans Biais de Variance Minimale (ESBVM).

En fait, c'est cette considération qui conditionne la définition formelle d'une statistique complète. Le théorème de Lehmann-Scheffé énonce que le résultat de la blackwellisation d'un estimateur sans biais quelconque (c'est à dire, de variance aussi grande que l'on veut) par une statistique exhaustive complète est un Estimateur Sans Biais de Variance Minimale (dont nous savons qu'il est unique) si la définition retenue pour une statistique complète est la suivante :

 

 

Une statistique T est dite complète s'il n'existe aucune fonction non triviale de T qui soit un estimateur sans biais de 0, et ce pour toute valeur de θ.

 


Rappelons qu'un estimateur sans biais de 0 est une statistique dont l'espérance est nulle quelle que soit la valeur du paramètre θ.

Donc une statistique T est dite complète si :

E[φ(T )] = 0 pour tout θ implique que φ(.) est la fonction identiquement nulle sur le support de la distribution.

 

Cette définition, peu intuitive, est en quelque sorte dictée par le désir d'obtenir le théorème de Lehmann-Scheffé.

Elle peut également s'interpréter de la façon suivante : si deux fonctions  φ1(T) et φ2(T) d'une statistique complète T ont la même espérance, alors ces deux fonctions sont nécessairement identiques. Sinon, [φ1(T) - φ2(T)] serait une fonction non identiquement nulle d'espérance nulle, c.à.d. un estimateur non trivial de 0. Autrement dit, si une statistique T est complète, la valeur de l'espérance d'une fonction φ(T) suffit à complètement caractériser la fonction φ(.).

-----

Il est important de remarquer que la notion de statistique complète porte non pas :

    * Sur la statistique elle même (p. ex. forme analytique de la fonction définissant la statistique à partir des observations),

    * Ni sur le fait qu'une statistique soit complète pour une distribution particulière, notion dénuée de signification,

mais sur la complétude de la statistique pour la famille de distributions p(x, θ).

Propriétés des statistiques complètes

Unicité d'une statistique complète

Nous montrerons qu'une statistique complète pour le paramètre θ, lorsquelle existe est unique à une bijection près.

Transformée bijective d'une statistique complète

Nous montrerons que si T est une statistique complète, et si f(.) est une fonction bijective quelconque, alors T ' = f(T) est également complète.

Une statistique complète est minimale (Bahadur)

L'approche intuitive de la notion de complétude d'une statistique exhaustive partait du concept de statistique exhaustive minimale dont on aurait totalement éliminé la partie inutile. Cependant, la définition finalement retenue d'une statistique complète ne fait pas référence au fait qu'elle soit exhaustive minimale, ni même exhaustive.

Nous montrerons cependant qu'une statistique complète est bien une statistique exhaustive minimale.

Statistique exhaustive minimale non complète

Nous avons mentionné qu'une statistique exhaustive minimale pouvait ne pas être complète. Nous montrerons qu'alors, la famille de distributions

p(x; θ) n'admet pas de statistique complète pour θ.

Statistique complète et famille exponentielle

L'identification directe de statistiques complètes peut être assez laborieuse. Heureusement, beaucoup des distributions de probabilité usuelles appartiennent à la famille exponentielle :

p(x; θ) = exp[A(x)B(θ) + C(x) + D(θ)]

pour laquelle nous avons déjà montré que la statistique

 

T = Σi A(xi)

 

est exhaustive.

On montre qu'elle est en fait exhaustive complète pour θ.

____________________________________________

 

 

 

Tutoriel

 

Dans ce Tutoriel, nous démontrons quelques résultats généraux relatifs aux statistiques complètes.

Nous donnons ensuite quelques exemples de statistiques complètes (dont nous avions précédemment montré qu'elles étaient exhaustives minimales) en n'utilisant que la définition d'une statistique complète. Rappelons cependant que la méthode la plus généralement utilisée pour démontrer la complétude d'une statistique consiste à montrer qu'elle est la statistique canonique d'une distribution appartenant à la famille exponentielle.


Certains résultats mathématiques difficiles seront énoncés sans démonstration.

 

 

STATISTIQUES COMPLETES

Une statistique complète est exhaustive minimale

Exemple de statistique exhaustive minimale qui n'est pas complète

Espérance de x(1)

Espérance de x(n)

La statistique n'est pas complète

Une statistique complète est unique à une bijection près

Tranformée bijective d'une statistique complète

S'il existe une statistique minimale non complète, il n'existe pas de statistique complète

Exemples de statistiques complètes

Distribution de Bernoulli

Distribution exponentielle

Distribution de Poisson

Distribution uniforme U[0, θ ]

TUTORIEL

 

_______________________________________________________

 

Voir aussi :

Statistique exhaustive minimale

Théorème de Lehmann-Scheffé

Téléchargez ce Glossaire