|
Animation interactive |
Poisson (Distribution de)
La distribution binomiale B(n, p) est une distribution fondamentale, mais d'utilisation malcommode en raison du fait qu'elle nécessite la manipulation de factorielles qui conduisent à des nombres gigantestques même pour des valeurs modérées de n. L'utilité d'une approximation simple de la distribution binomiale est donc apparu très tôt en Théorie des Probabilités.
Dès la fin du 18ème siècle, de Moivre, au prix de calculs longs et laborieux, identifia une telle distribution, que l'on appelle aujourd'hui la distribution normale. De nos jours, il suffit d'invoquer le Théorème Central Limite (TCL) pour se convaincre de l'exactitude de cette vue, la distribution binomiale étant la somme de variables de Bernoulli indépendantes et identiquement distribuées. Cependant, comme son nom le suggère, le TCL est un résultat asymptotique qui ne dit rien sur la qualité de l'approximation d'une somme finie de variables iid par la distribution normale. Or la distribution binomiale est fortement asymétrique pour les petites valeurs de p, et cette asymétrie rend mauvaise l'approximation de la distribution binomiale par la distribution normale, même pour de fortes valeurs de n.
Il existe heureusement une autre distribution, elle aussi très simple, qui fournit de la distribution binomiale une bien meilleure approximation que la distribution normale pour les petites valeurs de p. Cette distribution, dont propriétés sont détaillées ci-dessous, s'appelle la distribution de Poisson (image inférieure de l'illustration ci-dessus).
-----
Vous trouverez ici une animation permettant une comparaison entre les distributions binomiale et de Poisson.
La distribution de Poisson est définie comme la limite de la distribution binomiale B(n, p) sous les conditions suivantes :
* n tend vers l'infini,
* p tend vers 0,
d'une façon telle que le produit np conserve une valeur constante λ.
Cette définition se généralise au cas
où le produit np ne fait que tendre vers une limite positive λ quand
n tend vers l'infini.
La distribution de Poisson est définie sur l'ensemble des entiers (y compris 0), et ne dépend que du seul paramètre λ (alors que la distribution binomiale dépend des deux paramètres n et p). Donc toutes les distributions binomiales ayant une même valeur λ de leur produit np peuvent être approximées par la même distribution Poisson(λ), l'approximation étant d'autant meilleure que n est grand (et donc p petit).
Nous établirons les résultats suivants.
La distribution de Poisson est donnée par :
|
La moyenne de la distribution de Poisson est :
|
E[X] = λ |
La variance de la distribution de Poisson est :
|
Var(X) = λ |
La variance est donc égale à la moyenne.
La fgm de la distribution de Poisson est :
|
M(t) = exp{λ(et - 1)} |
Nous établirons ce résultat :
* Par calcul direct,
* Et également en calculant la limite de la fonction génératrice des moments de la distribution binomiale quand n tend vers l'infini avec np tendant vers une limite λ. La propriété de convergence de la fgm affirme alors que cette limite est la fgm de la distribution de Poisson.
Nous montrons ici que la fonction génératrice de la distribution de Poisson est
|
G(s) = eλ(s - 1) |
Nous retrouverons également ce résultat en calculant la limite de la fonction génératrice de la distribution binomiale.
Nous montrerons que la distribution de Poisson tend vers une distribution normale pour les grandes valeurs du paramètre λ (voir animation ci-dessous).
Soient
* X1 ~ Poisson(λ1),
* X2 ~ Poisson(λ2 ),
* X1 et X2 indépendantes.
Alors
|
(X1 + X2 ) ~ Poisson(λ1 + λ2 ) |
Cette animation simule la distribution de Poisson de la manière suivante :
1) Des observations sont tirées de la distribution exponentielle Exp(λ) (cadre jaune de l'animation).
2) Les valeurs de ces observations sont additionnées jusqu'à ce que leur somme dépasse 1.
3) Supposons que la somme des k premières observations soit inférieure à 1, mais que la valeur de la (k + 1)ème observation rende cette somme supérieure à 1. L'entier k est alors considéré comme une observation tirée de la distribution Poisson(λ).
L'animation semble donc simuler la distribution de Poisson par une voie détournée et tortueuse, mais nous montrerons plus bas qu'elle respecte en fait aussi bien la lettre que l'esprit de la définition de la distribution de Poisson.
|
Cadre supérieur La ligne verticale verte marque la moyenne de la distribution exponentielle. Changez la valeur de λ en faisant glisser l'extrémité supérieure de cette ligne avec votre souris.
Cadre intermédiaire Affiche la fonction de masse de la distribution de Poisson pour la valeur choisie de λ sous la forme de barres rouges. * Cliquez sur "Go". Les observations sont tirées de la distribution Poisson(λ) selon la méthode décrite ci-dessus. Observez la construction progressive de l'histogramme de cette distribution. * Cliquez sur "Pause", puis sur "Next". L'animation va maintenant tirer une par une des observations de la distribution exponentielle. La ligne horizontale prise en sandwich entre les cadres supérieur et inférieur affiche la somme courante des valeurs de ces observations. L'animation s'arrête quand cette somme dépasse 1, et la valeur de k est affichée dans le coin supérieur droit de l'animation. Cette valeur est égale au nombre de segments colorés sur la ligne. * Nous avons vu que la moyenne de la distribution Poisson(λ) est égale à λ. Il faut donc en moyenne (k + 1) tirages pour que la somme dépasse 1.
Cadre inférieur La courbe rouge est la distribution normale standard. Les barres jaunes représentent la distribution de Poisson standardisée. Observez que la distribution de Poisson tend vers une distribution normale quand λ prend de grandes valeurs, comme nous le démontrons plus bas.
|
La distribution de Poisson est utilisée pour décrire des situations dans lesquelles des évènements se produisent un par un à des dates aléatoires mais "uniformément" distribuées dans le temps.
Des exemples typiques sont :
* Clients arrivant dans une boutique.
* Fautes de frappe dans un texte long.
* Demande de connexion téléphonique de la part d'un appelant.
* Demande de service CPU ou I/O de la part d'une tâche informatique.
* etc...
Le nombre d'évènements se produisant dans une période donnée [t, t + Δt] sera alors souvent décrit convenablement par une variable aléatoire ayant une distribution de Poisson.
Dans une telle situation, on découpe le temps en tranches de durée δt, et on fait l'hypothèse qu'il y a une probabilité constante p = λδt pour qu'un unique évènement se produise dans cette tranche. Le nombre d'évènements se produisant dans l'intervalle de temps Δt = nδt suit donc la distribution de binomiale B(n, p).

Lorsque l'on fait diminuer δt (et donc également p) tout en gardant constant Δt, le nombre n de tranches temporelles augmente. Lorsque δt tend vers 0, le nombre k d'évènements dans Δt peut donc être regardé comme suivant la distribution binomiale B(n, p) avec n tendant vers l'infini et p tendant vers 0 d'une façon telle que np garde toujours la même valeur λ, et suive donc, par définition, la distribution de Poisson de paramètre
np = (Δt/δt).(λδt) = λ.Δt
-----
D'autre part, l'intervalle de temps entre deux évènements est une variable aléatoire qui, par définition, suit la distribution géométrique Géometrique(p).
Quand p = λδt tend vers 0, nous savons que la distribution limite de la distribution géométrique est la distribution exponentielle Exp(λ).
-----
Ainsi, le nombre d'évènements se produisant dans [t, t + Δt] peut être vu comme étant régi :
* Soit par la distribution limite de B(n, p) quand n tend vers l'infini et p tend vers 0 avec np = λ = Cte, c'est à dire la distribution Poisson(λΔt),
* Soit par la distribution du nombre d'intervalles de temps distribués comme Exp(λ) que l'on peut mettre dans [t, t + Δt].
L'équivalence de ces deux points de vue justifie la façon dont l'animation simule la distribution Poisson(λ).
_____________
Cette équivalence est établie de façon rigoureuse lors de l'étude des processus de Poisson.
Considérons l'intervalle de temps [0, t], et procédons exactement comme le fait l'animation : nous "enchaînons" les observations tirées de Exp(λ) jusqu'à ce que l'extrémité de la chaîne dépasse t.

Nous venons de justifier (informellement) que le nombre de "chaînons" dans ]0, t] (ici, 4) suit la distribution Poisson(λt).
Pour un entier k donné, considérons les deux évènements :
1) Tk est inférieur ou égal à t.
2) Il y a au moins k évènements dans [0, t].
Ces deux évènements sont clairement identiques, et leurs probabilités sont donc égales.
-----
La distribution de Tk est la distribution Gamma Γ(k, 1/λ).
Nous venons donc d'établir que
P{Tk ≤ t} = P{Poisson(λt) ≥ k}
Revenons à des notations plus traditionnelles pour la distribution Gamma ( β = 1/λ et n au lieu de k). Nous avons donc montré (informellement) que si X et Y sont deux variables aléatoires :
* X ~ Γ(n, β),
* Y ~ Poisson(x/β)
alors
| P{X ≤ x} = P{Y ≥ n} |
un résultat démontré ici.
La probabilité pour que X soit
inférieure où égale à x est, par définition,
la valeur de la fonction de répartition
Fn ,β (x) de Γ(n,
β) qui est calculée ici.
Nous montrons ici
que la moyenne empirique
est une statistique exhaustive pour le paramètre λ,
puis
que cette statistique est en fait exhaustive minimale.
Nous montrons ici
que la moyenne empirique
est un estimateur efficace du paramètre λ.
Nous montrons ici
que la distribution de Poisson fait partie de la famille exponentielle. Ceci
nous conduira à une deuxième démonstration de l'efficacité de
comme estimateur de λ.
_____________________________________________________________
|
Tutoriel 1 |
Nous commençons par calculer la distribution de Poisson définie comme limite d'une distribution binomiale quand n tend vers l'infini, p tend vers 0 et le produit np tend vers une limite λ. Puis nous calculerons à nouveau la distribution de Poisson en utilisant une méthode basée sur les propriétés de la fonction génératrice.
Nous utilisons ensuite un argument intuitif pour deviner la moyenne et la variance de la distribution de Poisson, avant de calculer ces grandeurs en n'ayant recours qu'à leur définitions élémentaires.
Nous calculons alors la Fonction Génératrice des Moments de la distribution de Poisson. Nous établirons ce résultat :
* Par un calcul direct,
* Mais également en calculant la limite de la fonction génératrice des moments de la distribution binomiale quand n tend vers l'infini avec np tendant vers une limite λ. La propriété de convergence de la fgm affirme alors que cette limite est la fgm de la distribution de Poisson.
Nous utiliserons alors cette fgm pour calculer à nouveau la moyenne et la variance de la distribution de Poisson. Cette approche s'avèrera être plus simple que le calcul direct.
La moyenne et la variance de la distribution de Poisson
sont également établies ici
en faisant appel aux propriétés de la fonction génératrice.
-----
Nous montrerons enfin que la distribution de Poisson tend vers une distribution normale pour les grandes valeurs du paramètre λ (voir animation). Nous obtiendrons ce résultat en montrant que la fgm de la distribution de Poisson standardisée converge vers celle de la distribution normale standard quand λ tend vers l'infini.
PROPRIETES ELEMENTAIRES
DE LA DISTRIBUTION DE POISSON
|
Distribution de probabilité Méthode directe Méthode par fonction génératrice Limite de la fonction génératrice de la distribution binomiale Distribution de Poisson Moyenne et variance (Calcul direct) Un argument intuitif Moyenne Variance Fonction génératrice des moments et moments Fonction génératrice des moments Calcul direct Limite de la fgm de la distribution binomiale Moyenne Variance Convergence vers la normale Fgm de la distribution de Poisson standardisée Développement en série de la fgm Limite de la fgm |
||
|
TUTORIEL |
||
_________________________________________________________
|
Tutoriel 2 |
Dans ce Tutoriel :
1) Nous montrons que la somme de deux variables de Poisson indépendantes est également une variable de Poisson dont nous calculons la valeur du paramètre. Cette propriété importante s'appelle "Additivité", et se rencontre chez d'autres variables classiques (p.ex. binomiale, Gamma).
L'additivité de la distribution de Poisson est également
établie ici en
faisant appel aux propriétés de la fonction génératrice.
2) Nous traitons ensuite le problème inverse : comment "décomposer" une variable de Poisson X en deux variables de Poisson indépendantes X1 et X2 et telles que X1 + X2 = X. Nous verrons comment l'introduction d'une suite de variables binomiales auxiliaires Zn~B(n, p) permet de résoudre le problème, et nous calculerons les paramètres respectifs de X1 et de X2 en fonction de p.
3) Nous montrons enfin que la distribution conjointe d'un ensemble de variables de Poisson indépendantes conditionnellement à leur somme est une distribution multinomiale.
ADDITIVITE ET DECOMPOSITION DE VARIABLES DE POISSON
VARIABLES DE POISSON CONDITIONNELLEMENT A LEUR SOMME
|
Additivité Un argument intuitif Calcul direct Par la fonction génératrice des moments Décomposition d'une variable de Poisson Le mécanisme de la décompostion Identification des composantes Généralisation Variables de Poisson conditionnellement à leur somme |
||
|
TUTORIEL |
||
_________________________________________________
Voir aussi :