Animation interactive

Poisson  (Distribution de)

Distribution binomiale et distribution normale

La distribution binomiale B(n, p) est une distribution fondamentale, mais d'utilisation malcommode en raison du fait qu'elle nécessite la manipulation de factorielles qui conduisent à des nombres gigantestques même pour des valeurs modérées de n. L'utilité d'une approximation simple de la distribution binomiale est donc apparu très tôt en Théorie des Probabilités.

Dès la fin du 18ème siècle, de Moivre, au prix de calculs longs et laborieux, identifia une telle distribution, que l'on appelle aujourd'hui la distribution normale. De nos jours, il suffit d'invoquer le Théorème Central Limite (TCL) pour se convaincre de l'exactitude de cette vue, la distribution binomiale étant la somme de variables de Bernoulli indépendantes et identiquement distribuées. Cependant, comme son nom le suggère, le TCL est un résultat asymptotique qui ne dit rien sur la qualité de l'approximation d'une somme finie de variables iid par la distribution normale. Or la distribution binomiale est fortement asymétrique pour les petites valeurs de p, et cette asymétrie rend mauvaise l'approximation de la distribution binomiale par la distribution normale, même pour de fortes valeurs de n.

 

 

 

Il existe heureusement une autre distribution, elle aussi très simple, qui fournit de la distribution binomiale une bien meilleure approximation que la distribution normale pour les petites valeurs de p. Cette distribution, dont propriétés sont détaillées ci-dessous, s'appelle la distribution de Poisson (image inférieure de l'illustration ci-dessus).

-----

Vous trouverez ici une animation permettant une comparaison entre les distributions binomiale et de Poisson.

Définition de la distribution de Poisson

La distribution de Poisson est définie comme la limite de la distribution binomiale B(n, p) sous les conditions suivantes :

    * n tend vers l'infini,

    * p tend vers 0,

d'une façon telle que le produit np conserve une valeur constante λ.


Cette définition se généralise au cas où le produit np ne fait que tendre vers une limite positive λ quand n tend vers l'infini. 

La distribution de Poisson est définie sur l'ensemble des entiers (y compris 0), et ne dépend que du seul paramètre λ (alors que la distribution binomiale dépend des deux paramètres n et p). Donc toutes les distributions binomiales ayant une même valeur λ de leur produit np peuvent être approximées par la même distribution Poisson(λ), l'approximation étant d'autant meilleure que n est grand (et donc p petit).

Propriétés de la distribution de Poisson

Nous établirons les résultats suivants.

Fonction de masse

La fonction de masse de la distribution de Poisson est :

 

Moyenne

La moyenne de la distribution de Poisson est :

 

E[X] = λ

Variance

La variance de la distribution de Poisson est :

Var(X) = λ

 

La variance est donc égale à la moyenne.

Fonction génératrice des moments

La fgm de la distribution de Poisson est :

M(t) = exp{λ(et - 1)}

 

Nous établirons ce résultat :

    * Par calcul direct,

    * Et également en calculant la limite de la fonction génératrice des moments de la distribution binomiale quand n tend vers l'infini avec np tendant vers une limite λ. La propriété de convergence de la fgm affirme alors que cette limite est la fgm de la distribution de Poisson.

Fonction génératrice

Nous montrons ici que la fonction génératrice de la distribution de Poisson est

 

G(s) = eλ(s - 1)

 

Nous retrouverons également ce résultat en calculant la limite de la fonction génératrice de la distribution binomiale.

Convergence vers la normale

Nous montrerons que la distribution de Poisson tend vers une distribution normale pour les grandes valeurs du paramètre λ (voir animation ci-dessous).

Additivité

Soient

    * X1 ~ Poisson1),

    * X2 ~ Poisson2 ),

    * X1 et X2 indépendantes.

Alors

 

(X1 + X2 ) ~ Poisson1 + λ2 )

Animation

Cette animation simule la distribution de Poisson de la manière suivante :

    1) Des observations sont tirées de la distribution exponentielle Exp(λ) (cadre jaune de l'animation).

    2) Les valeurs de ces observations sont additionnées jusqu'à ce que leur somme dépasse 1.

    3) Supposons que la somme des k premières observations soit inférieure à 1, mais que la valeur de la (k + 1)ème observation rende cette somme supérieure à 1. L'entier k est alors considéré comme une observation tirée de la distribution Poisson(λ).

 

L'animation semble donc simuler la distribution de Poisson par une voie détournée et tortueuse, mais nous montrerons plus bas qu'elle respecte en fait aussi bien la lettre que l'esprit de la définition de la distribution de Poisson.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

Cadre supérieur

La ligne verticale verte marque la moyenne de la distribution exponentielle. Changez la valeur de λ en faisant glisser l'extrémité supérieure de cette ligne avec votre souris.

 

Cadre intermédiaire

Affiche la fonction de masse de la distribution de Poisson pour la valeur choisie de λ sous la forme de barres rouges.

    * Cliquez sur "Go". Les observations sont tirées de la distribution Poisson(λ) selon la méthode décrite ci-dessus. Observez la construction progressive de l'histogramme de cette distribution.

    * Cliquez sur "Pause", puis sur "Next". L'animation va maintenant tirer une par une des observations de la distribution exponentielle. La ligne horizontale prise en sandwich entre les cadres supérieur et inférieur affiche la somme courante des valeurs de ces observations. L'animation s'arrête quand cette somme dépasse 1, et la valeur de k est affichée dans le coin supérieur droit de l'animation. Cette valeur est égale au nombre de segments colorés sur la ligne.

    * Nous avons vu que la moyenne de la distribution Poisson(λ) est égale à λ. Il faut donc en moyenne (k + 1) tirages pour que la somme dépasse 1.

 

Cadre inférieur

La courbe rouge est la distribution normale standard.

Les barres jaunes représentent la distribution de Poisson standardisée.

Observez que la distribution de Poisson tend vers une distribution normale quand λ prend de grandes valeurs, comme nous le démontrons plus bas.

 

 

Estimation du paramètre de la distribution de Poisson

Statistique exhaustive

Nous montrons :

    * Ici que la moyenne empirique  est une statistique exhaustive pour le paramètre λ de la distribution de Poisson,

    * Ici que cette statistique est non seulement exhaustive, mais en fait exhaustive minimale,

    * Et enfin ici qu'elle est complète.

ESBVM

Nous calculons ici l'ESBVM de toute fonction analytique du paramètre λ, avec les puissances entières de λ comme cas particulier. Comme cas encore plus particulier, nous constaterons que la moyenne empirique  est l'ESBVM du paramètre λ.

Un autre cas particulier important est celui de l'ESBVM de e, qui est également obtenu :

    * Ici comme application du théorème de Lehmann-Scheffé,

    * Et ici comme application du Corollaire du théorème de Lehmann-Scheffé.

Estimation efficace

Nous montrons ici que la moyenne empirique  est un estimateur efficace du paramètre λ de la distribution de Poisson.

Famille exponentielle

Nous montrons ici que la distribution de Poisson définit une famille exponentielle. Ceci nous conduira à une nouvelle démonstration de la complétude de la moyenne empirique , ainsi que de son efficacité comme estimateur de λ.

Distribution de Poisson et distribution exponentielle

La distribution de Poisson est utilisée pour décrire des situations dans lesquelles des évènements se produisent un par un à des dates aléatoires mais "uniformément" distribuées dans le temps.

Des exemples typiques sont :

    * Clients arrivant dans une boutique.

    * Fautes de frappe dans un texte long.

    * Demande de connexion téléphonique de la part d'un appelant.

    * Demande de service CPU ou I/O de la part d'une tâche informatique.

    * etc...

 

Le nombre d'évènements se produisant dans une période donnée [t, t + Δt] sera alors souvent décrit convenablement par une variable aléatoire ayant une distribution de Poisson.

Dans une telle situation, on découpe le temps en tranches de durée δt, et on fait l'hypothèse qu'il y a une probabilité constante p = λδt pour qu'un unique évènement se produise dans cette tranche. Le nombre d'évènements se produisant dans l'intervalle de temps Δt = nδt suit donc la distribution de binomiale B(n, p).

 

 

 

Lorsque l'on fait diminuer δt (et donc également p) tout en gardant constant Δt, le nombre n de tranches temporelles augmente. Lorsque δt tend vers 0, le nombre k d'évènements dans Δt peut donc être regardé comme suivant la distribution binomiale B(n, p) avec n tendant vers l'infini et p tendant vers 0 d'une façon telle que np garde toujours la même valeur λ, et suive donc, par définition, la distribution de Poisson de paramètre

np = (Δtt).(λδt) = λ.Δt

-----

D'autre part, l'intervalle de temps entre deux évènements est une variable aléatoire qui, par définition, suit la distribution géométrique Géometrique(p).

Quand p = λδt tend vers 0, nous savons que la distribution limite de la distribution géométrique est la distribution exponentielle Exp(λ).

-----

Ainsi, le nombre d'évènements se produisant dans [t, t + Δt] peut être vu comme étant régi :

    * Soit par la distribution limite de B(n, p) quand n tend vers l'infini et p tend vers 0 avec np = λ = Cte, c'est à dire la distribution Poisson(λΔt),

    * Soit par la distribution du nombre d'intervalles de temps distribués comme Exp(λ) que l'on peut mettre dans [t, t + Δt].

 

L'équivalence de ces deux points de vue justifie la façon dont l'animation simule la distribution Poisson(λ).

_____________

 

Cette équivalence est établie de façon rigoureuse lors de l'étude des processus de Poisson.

Distribution de Poisson et distribution Gamma

Considérons l'intervalle de temps [0, t], et procédons exactement comme le fait l'animation : nous "enchaînons" les observations tirées de Exp(λ) jusqu'à ce que l'extrémité de la chaîne dépasse t.

 

 

 

Nous venons de justifier (informellement) que le nombre de "chaînons" dans ]0, t] (ici, 4) suit la distribution Poissont).

Pour un entier k donné, considérons les deux évènements :

    1) Tk  est inférieur ou égal à t.

    2) Il y a au moins k évènements dans [0, t].

 

Ces deux évènements sont clairement identiques, et leurs probabilités sont donc égales.

-----

La distribution de Tk est la distribution Gamma Γ(k, 1/λ).

Nous venons donc d'établir que

P{Tk ≤ t} = P{Poissont) ≥ k}

Revenons à des notations plus traditionnelles pour la distribution Gamma ( β = 1/λ et n au lieu de k). Nous avons donc montré (informellement) que si X et Y sont deux variables aléatoires :

    * X ~ Γ(n, β),

    * Y ~ Poisson(x/β)

alors

 

P{X  x} = P{Y  n}

 

un résultat démontré ici.


La probabilité pour que X soit inférieure où égale à x est, par définition, la valeur de la fonction de répartition Fn ,β (x) de Γ(n, β) qui est calculée ici.

_____________________________________________________________

 

 

Tutoriel 1

 

Nous commençons par calculer la distribution de Poisson définie comme limite d'une distribution binomiale quand n tend vers l'infini, p tend vers 0 et le produit np tend vers une limite λ. Puis nous calculerons à nouveau la distribution de Poisson en utilisant une méthode basée sur les propriétés de la fonction génératrice.

Nous utilisons ensuite un argument intuitif pour deviner la moyenne et la variance de la distribution de Poisson, avant de calculer ces grandeurs en n'ayant recours qu'à leur définitions élémentaires.

Nous calculons alors la Fonction Génératrice des Moments de la distribution de Poisson. Nous établirons ce résultat :

    * Par un calcul direct,

    * Mais également en calculant la limite de la fonction génératrice des moments de la distribution binomiale quand n tend vers l'infini avec np tendant vers une limite λ. La propriété de convergence de la fgm affirme alors que cette limite est la fgm de la distribution de Poisson.

Nous utiliserons alors cette fgm pour calculer à nouveau la moyenne et la variance de la distribution de Poisson. Cette approche s'avèrera être plus simple que le calcul direct.


La moyenne et la variance de la distribution de Poisson sont également établies ici en faisant appel aux propriétés de la fonction génératrice.

-----

Nous montrerons enfin que la distribution de Poisson tend vers une distribution normale pour les grandes valeurs du paramètre λ (voir animation). Nous obtiendrons ce résultat en montrant que la fgm de la distribution de Poisson standardisée converge vers celle de la distribution normale standard quand λ tend vers l'infini.

 

 

 

PROPRIETES ELEMENTAIRES

DE LA DISTRIBUTION DE POISSON

Distribution de probabilité

Méthode directe

Méthode par fonction génératrice

Limite de la fonction génératrice de la distribution binomiale

Distribution de Poisson

Moyenne et variance (Calcul direct)

Un argument intuitif

Moyenne

Variance

Fonction génératrice des moments et moments

Fonction génératrice des moments

Calcul direct

Limite de la fgm de la distribution binomiale

Moyenne

Variance

Convergence vers la normale

Fgm de la distribution de Poisson standardisée

Développement en série de la fgm

Limite de la fgm

TUTORIEL

 

 

* Paramètre λ est réglable.
* Comparaison avec binomiale (n ou p réglables).

 _________________________________________________________

 

 

Tutoriel 2

 

Dans ce Tutoriel :

    1) Nous montrons que la somme de deux variables de Poisson indépendantes est également une variable de Poisson dont nous calculons la valeur du paramètre. Cette propriété importante s'appelle "Additivité", et se rencontre chez d'autres variables classiques (p.ex. binomiale, Gamma).


L'additivité de la distribution de Poisson est également établie ici en faisant appel aux propriétés de la fonction génératrice.

    2) Nous traitons ensuite le problème inverse : comment "décomposer" une variable de Poisson X en deux variables de Poisson indépendantes X1 et X2 et telles que X1X2 = X. Nous verrons comment l'introduction d'une suite de variables binomiales auxiliaires  Zn~B(n, p) permet de résoudre le problème, et nous calculerons les paramètres respectifs de X1 et de X2 en fonction de p.

    3) Nous montrons enfin que la distribution conjointe d'un ensemble de variables de Poisson indépendantes conditionnellement à leur somme est une distribution multinomiale.

 

 

 

ADDITIVITE ET DECOMPOSITION DE VARIABLES DE POISSON

VARIABLES DE POISSON CONDITIONNELLEMENT A LEUR SOMME

Additivité

Un argument intuitif

Calcul direct

Par la fonction génératrice des moments

Décomposition d'une variable de Poisson

Le mécanisme de la décompostion

Identification des composantes

Généralisation

Variables de Poisson conditionnellement à leur somme

TUTORIEL

 

_________________________________________________

 

Voir aussi :

Distribution binomiale

Distribution exponentielle

Processus de Poisson

Distribution multinomiale

Téléchargez ce Glossaire