Binomiale (Distribution, ou Loi)
Vous jouez à Pile ou Face avec une pièce dont la probabilité de retomber sur "Pile" est p, et donc la probabilité de retomber sur "Face" est q = 1 - p.
Vous lancez la pièce n fois, et la pièce
retombe k fois sur "Pile" (k
n).
Bien sûr, si vous procédez à une deuxième série de n lancers, vous vous
attendez à ce que le nombre de fois où la pièce retombe sur "Pile"
soit différent. Donc k est la réalisation d'une variable aléatoire que
nous désignons par X.
X suit, par définition, une distribution binomiale de paramètres n et p, qui est notée B(n, p). Cette distribution est entièrement définie par la liste des probabilités d'obtenir k "Piles" en n lancers, pour toutes les valeur de k de 0 à n. Ces probabilités sont notées Pn,p{X = k}.
-----
La distribution binomiale est donc la distribution de la somme de n variables de Bernoulli indépendantes et identiquement distribuées (iid) de paramètre commun p.
L'animation suivante illustre la distribution binomiale.
|
Configuration initiale L'animation s'ouvre sur une configuration initiale comprenant : 1) Un échantillon
de n réalisations d'une variable de Bernoulli de paramètre
p = 0,4. Cette probabilité est matérialisée par le rapport
de la longueur de la zone blanche du cadre supérieur à la longueur
totale de ce même cadre. * Lorsque p est
proche de 0,5, on voit que la distribution normale est une excellente
approximation de cette distribution, même pour des nombres de tirages modestes.
|
Nous établirons les propriétés suivantes de la distribution binomiale :
La probabilité d'obtenir k fois "Pile" dans une série de n lancers est :
|
|
où

est le nombre de façons de choisir k objets parmi n. Ce nombre s'appelle le coefficient binomial en raison du fait que c'est le nombre de fois où apparaît le monôme xkyn - k dans le développement du binôme
(x + y)n
C'est le nombre de Piles obtenu, en moyenne, dans une série de n lancers.
|
µ = np |
|
σ²= np(1 - p) |
Remarquez que la variance est très faible si p est proche de 0 ou bien de 1. Dans le premier cas, le nombre de Piles sera presque toujours très proche de 0, et presque toujours très proche de 1 dans l'autre cas : dans le deux cas, ce nombre est très stable..
Montrez que la variance est maximale pour p = 0,5.
-----
Le résultat ci-dessus peut également s'écrire :
σ²= µ(1 - µ)/n
Cette expression prendra tout son sens lorsque nous considérerons la distribution binomiale comme appartenant à la famille exponentielle.
L'animation suggère que la valeur de k pour laquelle P{X = k} est maximale (mode) est toujours à moins d'une unité de la valeur moyenne, un résultat que nous démontrerons.
Une façon courante d'exprimer ce résultat est de dire que la fréquence la plus probable des "Piles" est approximativement égale à p, la probabilité pour qu'un lancer produise un "Pile".
|
M(t) = (pet + q)n |
Nous utiliserons
cette fgm pour montrer que la distribution binomiale tend vers une distribution
normale pour de grandes tailles d'échantillon.
Nous montrons ici que la fonction génératrice de la distribution binomiale B(n, p) est :
|
G(s) = (q + ps)n |
Soient X1 et X2 deux variables binomiales indépendantes de distributions respectives B(n1 , p) et B(n2 , p). Alors la variable X = X1 + X2 a également une distribution binomiale de loi B(n1 + n2, p).
L'importance pratique de la distribution binomiale ne saurait être surestimée, car de très nombreux évènements peuvent s'interpréter comme résultant d'une suite d' "essais", chaque essai pouvant conduire à un "succès" ou à un "échec". La distribution binomiale est alors la distribution du nombre de succès dans une suite de n essais.
Mais l'importance de la distribution binomiale se fait également sentir au-delà de ses applications pratiques. En particulier, deux des résultats les plus importants relatifs aux variables aléatoires sont particulièrement bien illustrés par la distribution binomiale.
Si vous lancez une pièce honnête un grand nombre de fois, l'intuition vous dit que vous obtiendrez approximativement le même nombre de "Piles" et de "Faces". Plus généralement, si la pièce est biaisée, vous vous attendez à ce que le nombre de "Piles" soit approximativement égal au nombre total de lancers multiplié par la probabilité d'obtenir "Pile" pour un seul lancer.
Cette intuition est justifiée par la Loi Faible des Grands Nombres (LFGN).
La LFGN s'applique à des situations bien plus générales que le simple jeu de Pile ou Face, mais il est instructif de la démontrer directement dans ce cas particulier, ce que nous faisons ici. Il apparaît alors que la LFGN est simplement une propriété asymptotique du coefficient binomial (voir ci-dessus), et est donc un résultat d'analyse combinatoire.
Nous utilisons ci-dessous
une troisième méthode pour montrer que la distribution binomiale tend vers une
distribution normale quand n tend vers l'infini.
L'animation ci-dessus montre que lorsque le nombre n de tirages augmente, la distribution binomiale se rapproche de plus en plus d'une distribution normale, et ce d'autant plus que p est proche de 0,5.
De nos jours, ce résultat apparaît comme une conséquence immédiate du Théorème Central Limite (TCL). En deux mots, ce théorème énonce que ce type de convergence vers une distribution normale est extrêmement général, et n'est pas propre à la distribution binomiale.
Cependant, dans les premiers temps de la théorie des probabilités, le TCL n'était pas encore connu et ce résultat fut établi directement dans un théorème connu sous le nom de "théorème de de Moivre", que nous démontrerons.
Ainsi il apparaît à nouveau que dans le cas particulier de la distribution binomiale, la convergence de cette distribution vers une distribution normale est une propriété asymptotique du coefficient binomial, et est donc à nouveau un résultat d'analyse combinatoire.
Le calcul de P{X = k} exige le calcul de factorielles, une tâche rapidement insurmontable même pour des ordinateurs. Le besoin de calculer simplement et rapidement des valeurs approximatives des probabilités binomiales se fit donc immédiatement sentir. En fait, le travail de de Moivre était motivé par la nécessité de calculer, même approximativement, des probabilités binomiales pour des valeurs de n supérieures à quelques unités.
* Mais quand p est proche de 0 ou de 1, la distribution binomiale est fortement asymétrique et l'approximation normale perd de son efficacité. Le besoin se fait alors sentir d'une autre approximation "spécialisée" dans les valeurs extrêmes de p. Cette nouvelle approximation de la distribution binomiale est connue sous le nom de distribution de Poisson.
-----
De nos jours, l'importance de la distribution de Poisson dépasse largement le cadre de la seule approximation de la distribution binomiale pour les valeurs extrêmes de p.
Les tirages donnant naissance à la distribution binomiale ne produisent que deux résultats : "Pile" ou bien "Face". Si les tirages peuvent produire plus de deux résultats différents (comme par exemple avec un dé), la distribution correspondante est alors la distribution multinomiale, qui généralise donc la distribution binomiale.
Nous utilisons la distribution binomiale pour illustrer le fait que la Méthode des Moments peut être utilisée pour estimer simultanément plusieurs paramètres d'une distribution même lorsque ces paramètres ne sont pas des moments (comme c'est le cas, par exemple, pour la distribution normale).
Dans le Tutoriel ci-dessous, nous utilisons la Méthode des Moments pour estimer simultanément les paramètres n et p de la distribution binomiale B(n, p).
La distribution binomiale conduit souvent à des calculs volumineux, voire inextricables. Cependant, nous montrerons que n peut également être estimé par la méthode du Maximum de Vraissemblance (en supposant p connu). Le résultat ne se présente pas sous une forme analytique fermée, mais sous la forme d'une équation qui peut être résolue par des méthodes numériques.
* Nous calculons ici la distribution du nombre de Piles dans les m premiers lancers d'une série de n lancers conditionnellement au nombre total de Piles dans la série complète de n lancers. Ce calcul apparaît au cours de l'identification d'une statistique exhaustive pour le paramètre p de la distribution binomiale.
* Dans la même veine, nous calculons ici l'espérance de ce même nombre de Piles.
-----
* Nous calculons ici les distributions de deux variables binomiales indépendantes de même paramètre p mais de tailles différentes conditionnellement à la valeur de leur somme. Le résultat sera la clé du test de Fisher-Irwin, qui permet de tester l'égalité des valeurs des paramètres p de deux distributions de Bernoulli indépendantes.
-----
* Sous certaines conditions, la distribution hypergéométrique converge vers une distribution binomiale lorsque la taille de la population (finie) tend vers l'infini.
Utilisez notre Calculette Binomiale pour calculer les probabilités ou probabilités cumulées dont vous avez besoin.
___________________________________________________
|
Tutoriel 1 |
Nous établissons ici les résultats élémentaires relatifs à la distribution binomiale.
La moyenne et la variance de la distribution binomiale sont
également établies ici
en faisant appel aux propriétés de la fonction génératrice.
La propriété
d'additivité est également établie ici
en faisant appel aux propriétés de la fonction génératrice.
Puis nous montrons directement (c.à.d. sans faire appel au Théorème Central Limite) que la distribution binomiale tend vers une distribution normale quand n tend vers l'infini. Nous le ferons en montrant que la fonction génératrice des moments de la distribution binomiale standardisée converge vers la fgm de la distribution normale standard.
-----
Nous concluons ce Tutoriel en estimant n de deux façons différentes :
* Par la Méthode des Moments.
* Par la méthode du Maximum de Vraisemblance.
DISTRIBUTION BINOMIALE : PROPRIETES ELEMENTAIRES
|
Fonction de probabilité Moyenne µ Variance σ² Mode Fonction génératrice des moments Méthode directe Méthode indirecte Moments Fonction génératrice Additivité Méthode directe Par la fonction génératrice des moments Convergence vers la normale par limite de la fgm Fgm de la distribution binomiale standardisée Développement de Taylor de la fgm Limite de la fgm Estimation Estimation simultanée de n et de p par la Méthode des Moments Estimation de n (p connu) par la méthode du Maximum de Vraisemblance |
||
|
TUTORIEL |
||
__________________________________________________________________
|
Tutoriel 2 |
Dans ce ce Tutoriel, nous démontrons le Théorème de de Moivre (ou parfois "de Laplace-Gauss") qui établit que la distribution binomiale tend vers une distribution normale lorsque n, le nombre de tirages, tend vers l'infini.
De nos jours, le théorème de de Moivre est occulté par le Théorème Central Limite (TCL), d'une portée beaucoup plus générale. De plus, nous avons déjà démontré ce résultat dans le Tutoriel précédent en calculant la limite de la fonction génératrice des moments de la distribution binomiale. Néanmoins, il paraît opportun de ne pas laisser sombrer dans l'oubli ce petit exploit qui a marqué l'histoire de la théorie des probabilités, ne serait-ce que pour rappeler le haut niveau de sophistication de la pensée mathématique en une période aussi éloignée de nous que l'est le début du XVIIIème siècle.
La démonstration que nous donnons reproduit assez fidèlement celle de de Moivre (complétée par son ami Stirling), que nous avons simplement adaptée aux notations modernes.
THEOREME DE DE MOIVRE
|
Centrage de la distribution binomiale Probabilités consécutives Les probabilités rapportées à celle du mode Coefficient de normalisation La limite normale |
||
|
TUTORIEL |
||
____________________________________________________
Voir aussi:
|
Distribution multinomiale |
|
|
Rôle de B(n, p) dans les Statistiques d'Ordre |
|
|
Distribution binomiale et distribution de Poisson |
|
|
Rôle de B(n, p) dans la stabilité des histogrammes |
|
|
Distribution binomiale négative |
|
|
La distribution binomiale comme limite de la distribution hypergéométrique |
|
|
Distributions de variables binomiales conditionnellement à leur somme |