Géométrique  (Distribution)

Définition de la distribution géométrique

Vous jouez à Pile-ou-Face. Vous décidez de jouer jusqu'à ce qu'apparaisse Pile pour la première fois, et d'arrêter alors la partie. Combien de fois devrez vous lancer la pièce?

Si, après une première partie, vous décidez d'en jouer une deuxième, vous vous attendez à ce que, probablement, le nombre de lancers que vous devrez effectuer pour "gagner" cette seconde partie soit différent du nombre de lancers dont vous avez eu besoin pour gagner la première. Le nombre X de lancers nécessaires pour gagner une partie est donc une variable aléatoire. La distribution de cette v.a. est, par définition, la distribution géométrique.

 

On peut tout de suite remarquer que la distribution de cette variable dépend certainement du biais de la pièce. Soit p la probabilité pour que la pièce retombe sur Pile (et q = 1 - p la probabilité pour que la pièce retombe sur Face). Pour une pièce non biaisée, p = q = 0,5. Mais si p = 0,9, on s'attend à ce que, en moyenne, les parties soient beaucoup plus courtes que pour une pièce non biaisée.

Animation

Cette animation illustre la distribution géométrique.

 

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

La probabilité p

    Faites glisser avec votre souris la limite entre les zones blanche et grise du rectangle supérieur. Vous ajustez ainsi la valeur de la probabilité p, qui est égale au rapport de la longueur de la zone blanche à la longueur totale du rectangle.

 

Cadre inférieur

    Le cadre inférieur montre la Distribution Géométrique pour la valeur de p choisie. Cette distribution change quand vous faites varier p : elle s'étale vers la droite et s'aplatit pour les petites valeurs de p, mais conserve toujours son caractère "exponentiel décroissant", illustré par une courbe exponentielle de constante q. Pour de grandes valeurs de p, la probabilité d'avoir à attendre plus de quelques lancers avant de voir apparaître Pile devient négligeable.

Il est parfois considéré comme surprenant que Pile apparaisse plus fréquemment en première position qu'en n'importe quelle autre position, et ce quelle que soit la valeur de p. Ainsi, pour de très petites valeurs de p, ne devrait-on pas s'attendre à ce qu'il soit extrêmement improbable de tirer Pile dès le premier lancer ? Ne devrait-on pas plutôt s'attendre à ce qu'il faille, le plus souvent, lancer la pièce un grand nombre de fois avant d'obtenir Pile pour la première fois, et donc d'observer un maximum de fréquence pour une valeur de k plus grande que 1 ?

Cette remarque illustre la différence entre "mode" (valeur pour laquelle la probabilité est maximale) et "moyenne". Il est vrai que la valeur moyenne du nombre de lancers nécessaires pour obtenir une première fois Pile augmente quand la probabilité p diminue. Par contre, quelle que soit la valeur de p, Pile apparaît plus souvent en première position qu'en n'importe quelle autre position.

 

La ligne bleue verticale matérialise la moyenne de la distribution.

 

Observez que lorsque p parcourt l'étendue disponible, la hauteur de chaque case rose passe par un maximum. Pour une case donnée k, il apparaît visuellement que ce maximum se produit lorsque la valeur de la moyenne de la distribution est justement égale à k. Ceci est vrai. Pouvez-vous le démontrer ?

 

Animation

    Cliquez sur "Go", et observez la construction de l'histogramme de la distribution géométrique.

    Cliquez sur "Pause", puis sur "Next". Un échantillon se construit pas à pas. La construction se poursuit tant que les points tirés tombent dans la zone grise (ce qui se produit, pour chaque nouveau point, avec la probabilité q = 1 - p), et se termine au premier point (rouge) qui tombe dans la zone blanche (avec la probabilité p). En cliquant à nouveau sur "Next", vous créez un nouvel échantillon etc...

 

Relancez l'animation en cliquant sut "Resume".

 

Définition alternative de la distribution géométrique

La Distribution Géométrique est parfois présentée comme celle du  nombre de lancers précédant la première apparition de Pile (au lieu du nombre de lancers nécessaires pour obtenir Pile pour la première fois). Si X ' désigne la variable répondant à cette définition, on a évidemment :

X ' = X - 1

A titre d'exercice, on retrouvera les propriétés de base de la Distribution Géométrique :

    * Soit en les calculant directement,

    * Soit en en utilisant les résultats relatifs aux fonctions de variables aléatoires, X' étant une translatée de X (voir ici).

Propriétés élémentaires de la distribution géométrique

Les propriétés élémentaires de la distribution géométrique sont les suivantes :

Fonction de masse P{X = n}

La probabilité P{X = n} pour qu'il faille lancer la pièce n fois avant d'obtenir le premier Pile est :
 

P{X = n} = p.qn - 1

 

Fonction de répartition F(n)

Par définition, F(n) est la probabilité pour qu'il faille au plus n lancers pour obtenir le premier Pile. On a :
 

F(n) = P{X n} = 1 - qn

 

Moyenne

On a :

µ = 1/p

 

Nous calculons ici les ESBVM :

    * De la moyenne 1/p,

    * Et de p (plus difficile !)

de la distribution géométrique.

Variance

On a :

 

σ² = q/p²

 

Notons que ce résultat peut s'écrire :

σ² = µ(µ - 1)

Cette expression prendra tout sons sens lorsque nous considérerons la distribution géométrique comme membre de la famille exponentielle.

-----

Nous calculons ici l'ESBVM de la variance de la distribution géométrique. 

Fonction génératrice des moments

La fonction génératrice des moments de la distribution géométrique est :

 

 

Fonction génératrice

Nous montrons ici que la fonction génératrice de la distribution géométrique est

 

 

La distribution géométrique est sans mémoire

Le concept de "processus sans mémoire" est exposé ici (dans le contexte de la distribution exponentielle). Cette propriété se traduit par la relation :

 

qui, dans le cas de la distribution géométrique, se traduit par :

 

Cette propriété caractéristique montre le lien étroit entre Distribution Géométrique et Distribution Exponentielle. Ce lien est visualisé dans l'animation interactive.

 

En fait, la Distribution Géométrique peut être perçue comme la version discrète de la Distribution Exponentielle. Ce lien peut être formalisé de la façon suivante : si on fait tendre vers 0 l'intervalle de temps entre deux tirages consécutifs, alors on montre que la fonction de répartition de la distribution géométrique tend vers la fonction de répartition d'une distribution exponentielle.

Ce lien entre distribution géométrique et distribution exponentielle est à la base de l'interprétation intuitive des processus de Poisson.

 

Nous calculons :
    * La moyenne (ici),
    * La fonction génératrice des moments (ici),
de la distribution géométrique par des méthodes qui ne font appel qu'à la propriété d'absence de mémoire et à la notion d'espérance conditionnelle.

Extension de la distribution géométrique : la distribution binomiale négative

Au lieu d'arrêter le jeu à la première apparition de Pile, on peut décider de continuer à jouer jusqu'à ce que Pile soit apparu exactement n fois (n 1). Le nombre de lancers nécessaire pour obtenir n fois Pile est une variable aléatoire qui suit, par définition, une loi dite "binomiale négative".

____________________________________________________________

 

Tutoriel

 

Tous ces résultats sont démontrés dans le Tutoriel sur la Distribution Géométrique. Nous remarquerons à nouveau la grande efficacité de la Fonction Génératrice des Moments, qui nous permettra de retrouver la moyenne et la variance de la distribution géométrique plus simplement que par le calcul direct.

-----

Nous éclaircissons également le lien entre variables géométriques et exponentielles en montrant qu'une variable géométrique peut être considérée comme résultant de la discrétisation d'une variable exponentielle. Le lien inverse (variable exponentielle comme limite d'une suite de variables géométriques) est abordé ici.

 

 

DISTRIBUTION GEOMETRIQUE

Fonction de masse de la distribution géométrique

Fonction de répartition

Moyenne µ  (Calcul direct)

Variance (Calcul direct)

Fonction génératrice des moments

F.g.m.

Moyenne

Variance

Absence de mémoire de la distribution géométrique

Variable géométrique comme version discrète d'une variable exponentielle

TUTORIEL

 

__________________________________________________________

 

Voir aussi :

Distribution exponentielle

Distribution binomiale négative

 

Téléchargez ce Glossaire