Binomiale  (Distribution, ou Loi)

Vous jouez à Pile ou Face avec une pièce dont la probabilité de retomber sur "Pile" est p, et donc la probabilité de retomber sur "Face" est q = 1 - p.

Vous lancez la pièce n fois, et la pièce retombe k fois sur "Pile" (k n). Bien sûr, si vous procédez à une deuxième série de n lancers, vous vous attendez à ce que le nombre de fois où la pièce retombe sur "Pile" soit différent. Donc k est la réalisation d'une variable aléatoire que nous désignons par X.

 

X suit, par définition, une distribution binomiale de paramètres n et p, qui est notée B(n, p). Cette distribution est entièrement définie par la liste des probabilités d'obtenir k "Piles" en n lancers, pour toutes les valeur de k de 0 à n. Ces probabilités sont notées Pn,p{X = k}.

-----

La distribution binomiale est donc la distribution de la somme de n variables de Bernoulli indépendantes et identiquement distribuées (iid) de paramètre commun p.

Animation

L'animation suivante illustre la distribution binomiale.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

 

 

Configuration initiale

L'animation s'ouvre sur une configuration initiale comprenant :

    1) Un échantillon de n réalisations d'une variable de Bernoulli de paramètre p = 0,4. Cette probabilité est matérialisée par le rapport de la longueur de la zone blanche du cadre supérieur à la longueur totale de ce même cadre.
Les points rouges et noirs ont été tirés d'une distribution uniforme sur toute la longueur du cadre supérieur  Un point a ainsi :
        * Une probabilité p d'être dans la zone blanche (points rouges). Il est alors considéré comme un "Pile", ou un "succès".
        * Une probabilité (1 - p) d'être dans la zone grise (points noirs). Il est alors considéré comme un "Face", ou un "échec".

   2) Dans le cadre intermédiaire, l'histogramme théorique de la distribution binomiale B(n, p). La ligne verticale bleue marque la moyenne de la distribution.
----------
A chaque fois que vous cliquez sur "Next", un nouvel échantillon de n observations est tiré de cette même loi de Bernoulli. Observez que le nombre de "Piles" varie de façon aléatoire.
La distribution binomiale B(n, p) affichée est celle du nombre de points rouges.

Réglages
   1) Probabilité p
       Faites varier la valeur de p en faisant glisser avec votre souris la frontière entre les zones blanche et grise du cadre supérieur. Observez les modifications de la distribution binomiale B(n, p) en fonction de la valeur de p. En particulier, remarquez que cette distribution est presque symétrique pour les valeurs de p proches de 0,5, alors qu'elle devient asymétrique lorsque la valeur de p s'éloigne de 0,5.

   2) Nombre de tirages
       Faites varier n, le nombre de "lancers" de la pièce de monnaie, avec les boutons accompagnant l'affichage "Nb. draws".
Lorsque n = 1, la distribution binomiale devient la distribution de Bernoulli de paramètre p.
-----
Observez que pour une valeur de p donnée, la distribution binomiale ressemble de plus en plus à une distribution normale quand le nombre de tirages augmente.

Théorème Central Limite
Cette impression est confirmée visuellement par l'affichage du cadre inférieur (fond gris). La courbe rouge est la distribution normale standard, et les barres verticales jaunes représentent la distribution binomiale B(n, p) standardisée.

   * Lorsque p est proche de 0,5, on voit que la distribution normale est une excellente approximation de cette distribution, même pour des nombres de tirages modestes.
   * Lorsque p s'écarte sensiblement de 0,5, l'approximation devient moins bonne en raison de l'asymétrie de la distribution binomiale. Elle s'améliore cependant en augmentant la valeur de n.
-----
Ainsi il apparaît que :
   * Lorsque n augmente, la distribution binomiale converge vers une distribution normale "discrétisée". Ce résultat est une conséquence directe du Théorème Central Limite (TCL).
   * Cependant, cette convergence devient de plus en plus difficile lorsque p s'éloigne de 0,5 en raison de l'asymétrie de la distribution binomiale. Le besoin se fait alors sentir d'une autre distribution approximant la distribution binomiale : cette distribution est la distribution de Poisson.
 
Animation
Cliquez sur "Go" et observez la construction progressive de l'histogramme de la distribution binomiale B(n, p).

 

 

Propriétés élémentaires de la distribution binomiale

Nous établirons les propriétés suivantes de la distribution binomiale :

Distribution de probabilité

La probabilité d'obtenir k fois "Pile" dans une série de n lancers est :

 

 

 

 

est le nombre de façons de choisir k objets parmi n. Ce nombre s'appelle le coefficient binomial en raison du fait que c'est le nombre de fois où apparaît le monôme xkyn - k dans le développement du binôme

(x + y)n

Moyenne

C'est le nombre de Piles obtenu, en moyenne, dans une série de n lancers.

 

µ = np

Variance


σ²= np(1 - p)

 

 

Remarquez que la variance est très faible si p est proche de 0 ou bien de 1. Dans le premier cas, le nombre de Piles sera presque toujours très proche de 0, et presque toujours très proche de 1 dans l'autre cas : dans le deux cas, ce nombre est très stable..


Montrez que la variance est maximale pour p = 0,5.

-----

Le résultat ci-dessus peut également s'écrire :

σ²= µ(1 - µ)/n

Cette expression prendra tout son sens lorsque nous considérerons la distribution binomiale comme appartenant à la famille exponentielle.

Mode

L'animation suggère que la valeur de k pour laquelle P{X = k} est maximale (mode) est toujours à moins d'une unité de la valeur moyenne, un résultat que nous démontrerons.

Une façon courante d'exprimer ce résultat est de dire que la fréquence la plus probable des "Piles" est approximativement égale à p, la probabilité pour qu'un lancer produise un "Pile".

Fonction génératrice des moments

 

M(t) = (pet + q)n

 


Nous utiliserons cette fgm pour montrer que la distribution binomiale tend vers une distribution normale pour de grandes tailles d'échantillon.

Fonction génératrice

Nous montrons ici que la fonction génératrice de la distribution binomiale B(n, p) est :

 

G(s) = (q + ps)n

 

Additivité

Soient X1 et X2  deux variables binomiales indépendantes de distributions respectives B(n1 , p) et B(n2 , p). Alors la variable X = X1X2 a également une distribution binomiale de loi B(n1 + n2, p).

Importance de la distribution binomiale

L'importance pratique de la distribution binomiale ne saurait être surestimée, car de très nombreux évènements peuvent s'interpréter comme résultant d'une suite d' "essais", chaque essai pouvant conduire à un "succès" ou à un "échec". La distribution binomiale est alors la distribution du nombre de succès dans une suite de n essais.

Mais l'importance de la distribution binomiale se fait également sentir au-delà de ses applications pratiques. En particulier, deux des résultats les plus importants relatifs aux variables aléatoires sont particulièrement bien illustrés par la distribution binomiale.

Loi Faible des Grands Nombres

Si vous lancez une pièce honnête un grand nombre de fois, l'intuition vous dit que vous obtiendrez approximativement le même nombre de "Piles" et de "Faces". Plus généralement, si la pièce est biaisée, vous vous attendez à ce que le nombre de "Piles" soit approximativement égal au nombre total de lancers multiplié par la probabilité d'obtenir "Pile" pour un seul lancer.

Cette intuition est justifiée par la Loi Faible des Grands Nombres (LFGN).

La LFGN s'applique à des situations bien plus générales que le simple jeu de Pile ou Face, mais il est instructif de la démontrer directement dans ce cas particulier, ce que nous faisons ici. Il apparaît alors que la LFGN est simplement une propriété asymptotique du coefficient binomial (voir ci-dessus), et est donc un résultat d'analyse combinatoire.


Nous utilisons ci-dessous une troisième méthode pour montrer que la distribution binomiale tend vers une distribution normale quand n tend vers l'infini.

Théorème Central Limite

L'animation ci-dessus montre que lorsque le nombre n de tirages augmente, la distribution binomiale se rapproche de plus en plus d'une distribution normale, et ce d'autant plus que p est proche de 0,5.

De nos jours, ce résultat apparaît comme une conséquence immédiate du Théorème Central Limite (TCL). En deux mots, ce théorème énonce que ce type de convergence vers une distribution normale est extrêmement général, et n'est pas propre à la distribution binomiale.

Cependant, dans les premiers temps de la théorie des probabilités, le TCL n'était pas encore connu et ce résultat fut établi directement dans un théorème connu sous le nom de "théorème de de Moivre", que nous démontrerons.

Ainsi il apparaît à nouveau que dans le cas particulier de la distribution binomiale, la convergence de cette distribution vers une distribution normale est une propriété asymptotique du coefficient binomial, et est donc à nouveau un résultat d'analyse combinatoire.

Distribution binomiale et distribution de Poisson

Le calcul de P{X = k} exige le calcul de factorielles, une tâche rapidement insurmontable même pour des ordinateurs. Le besoin de calculer simplement et rapidement des valeurs approximatives des probabilités binomiales se fit donc immédiatement sentir. En fait, le travail de de Moivre était motivé par la nécessité de calculer, même approximativement, des probabilités binomiales pour des valeurs de n supérieures à quelques unités.

    * Quand p est proche de 0,5, l'approximation normale fournit simplement des valeurs assez précises même pour des tailles d'échantillon modestes (voir animation).

    * Mais quand p est proche de 0 ou de 1, la distribution binomiale est fortement asymétrique et l'approximation normale perd de son efficacité. Le besoin se fait alors sentir d'une autre approximation "spécialisée" dans les valeurs extrêmes de p. Cette nouvelle approximation de la distribution binomiale est connue sous le nom de distribution de Poisson.

-----

De nos jours, l'importance de la distribution de Poisson dépasse largement le cadre de la seule approximation de la distribution binomiale pour les valeurs extrêmes de p.

Distribution multinomiale

Les tirages donnant naissance à la distribution binomiale ne produisent que deux résultats : "Pile" ou bien "Face". Si les tirages peuvent produire plus de deux résultats différents (comme par exemple avec un dé), la distribution correspondante est alors la distribution multinomiale, qui généralise donc la distribution binomiale.

Estimation des paramètres

Estimation par la méthode des moments

Nous utilisons la distribution binomiale pour illustrer le fait que la Méthode des Moments peut être utilisée pour estimer simultanément plusieurs paramètres d'une distribution même lorsque ces paramètres ne sont pas des moments (comme c'est le cas, par exemple, pour la distribution normale).

Dans le Tutoriel ci-dessous, nous utilisons la Méthode des Moments pour estimer simultanément les paramètres n et p de la distribution binomiale B(n, p).

Estimation par Maximum de Vraisemblance

La distribution binomiale conduit souvent à des calculs volumineux, voire inextricables. Cependant, nous montrerons que n peut également être estimé par la méthode du Maximum de Vraissemblance (en supposant p connu). Le résultat ne se présente pas sous une forme analytique fermée, mais sous la forme d'une équation qui peut être résolue par des méthodes numériques.

Résultats additionnels

        * Nous calculons ici la distribution du nombre de Piles dans les m premiers lancers d'une série de n lancers conditionnellement au nombre total de Piles dans la série complète de n lancers. Ce calcul apparaît au cours de l'identification d'une statistique exhaustive pour le paramètre p de la distribution binomiale.

        * Dans la même veine, nous calculons ici l'espérance de ce même nombre de Piles.

-----

        * Nous calculons ici les distributions de deux variables binomiales indépendantes de même paramètre p mais de tailles différentes conditionnellement à la valeur de leur somme. Le résultat sera la clé du test de Fisher-Irwin, qui permet de tester l'égalité des valeurs des paramètres p de deux distributions de Bernoulli indépendantes.

-----

    * Sous certaines conditions, la distribution hypergéométrique converge vers une distribution  binomiale lorsque la taille de la population (finie) tend vers l'infini.

Calculette

Utilisez notre Calculette Binomiale pour calculer les probabilités ou probabilités cumulées dont vous avez besoin.

 

___________________________________________________

 

 

Tutoriel 1

 

Nous établissons ici les résultats élémentaires relatifs à la distribution binomiale.


La moyenne et la variance de la distribution binomiale sont également établies ici en faisant appel aux propriétés de la fonction génératrice.
La propriété d'additivité est également établie ici en faisant appel aux propriétés de la fonction génératrice.

Puis nous montrons directement (c.à.d. sans faire appel au Théorème Central Limite) que la distribution binomiale tend vers une distribution normale quand n tend vers l'infini. Nous le ferons en montrant que la fonction génératrice des moments de la distribution binomiale standardisée converge vers la fgm de la distribution normale standard.

-----

Nous concluons ce Tutoriel en estimant n de deux façons différentes :

    * Par la Méthode des Moments.

    * Par la méthode du Maximum de Vraisemblance.

 

 

 

DISTRIBUTION BINOMIALE : PROPRIETES ELEMENTAIRES

Fonction de probabilité

Moyenne µ

Variance σ²

Mode

Fonction génératrice des moments

Méthode directe

Méthode indirecte

Moments

Fonction génératrice

Additivité

Méthode directe

Par la fonction génératrice des moments

Convergence vers la normale par limite de la fgm

Fgm de la distribution binomiale standardisée

Développement de Taylor de la fgm

Limite de la fgm

Estimation

Estimation simultanée de n et de p par la Méthode des Moments

Estimation de n (p connu) par la méthode du Maximum de Vraisemblance

TUTORIEL

__________________________________________________________________

 

 

Tutoriel 2

 

Dans ce ce Tutoriel, nous démontrons le Théorème de de Moivre (ou parfois "de Laplace-Gauss") qui établit que la distribution binomiale tend vers une distribution normale lorsque n, le nombre de tirages, tend vers l'infini.

De nos jours, le théorème de de Moivre est occulté par le Théorème Central Limite (TCL), d'une portée beaucoup plus générale. De plus, nous avons déjà démontré ce résultat dans le Tutoriel précédent en calculant la limite de la fonction génératrice des moments de la distribution binomiale. Néanmoins, il paraît opportun de ne pas laisser sombrer dans l'oubli ce petit exploit qui a marqué l'histoire de la théorie des probabilités, ne serait-ce que pour rappeler le haut niveau de sophistication de la pensée mathématique en une période aussi éloignée de nous que l'est le début du XVIIIème siècle.

La démonstration que nous donnons reproduit assez fidèlement celle de de Moivre (complétée par son ami Stirling), que nous avons simplement adaptée aux notations modernes.

 

 

 

THEOREME DE DE MOIVRE

Centrage de la distribution binomiale

Probabilités consécutives

Les probabilités rapportées à celle du mode

Coefficient de normalisation

La limite normale

TUTORIEL

 

____________________________________________________

 

Voir aussi:

Distribution multinomiale

Rôle de B(n, p) dans les Statistiques d'Ordre

Distribution binomiale et distribution de Poisson

Rôle de B(n, p) dans la stabilité des histogrammes

Distribution binomiale négative

La distribution binomiale comme limite de la distribution hypergéométrique

Distributions de variables binomiales conditionnellement à leur somme

Téléchargez ce Glossaire