Multinomiale (Distribution, ou loi)
La distribution binomiale B(n, p) est obtenue en considérant une suite de n tirages indépendants au jeu de Pile ou Face, p étant la probabilité de tirer Pile.
La distribution multinomiale est une généralisation de la distribution binomiale au cas où chaque "lancer" peut produire non pas deux, mais plus de deux résultats différents. Par exemple, on pourra imaginer une suite de n lancers d'un "dé" à k faces, la face n°i ayant la probabilité pi de sortir.
Un distribution multinomiale est donc caratérisée par la donnée de :
* n, le nombre de lancers.
* La suite {p1, p2 , ..., pk} avec p1 + p2 + ..., pk = 1
-----
A la suite de n lancers, nous désignerons par ni le nombre de lancers ayant produit le résultat n°i. Nous avons donc n1 + n2 + ..., nk = n. Les lancers étant aléatoires, les ni sont des réalisations de k variables aléatoires que nous noterons Ni (i = 1, 2, ..., k). Ces variables ne sont pas indépendantes puisqu'elles sont liées par la relation Si Ni = n.
On appelle distribution multinomiale Mult(n, p1, p2 , ..., pk ) la distribution conjointe des k variables aléatoires Ni. C'est donc une distribution multivariée discrète. Son support est l'ensemble des k-uplets de nombres entiers positifs ou nuls {n1, n2, ..., nk} tels que n1 + n2 + ...+ nk = n.
La distribution Mult(n, p1, p2 , ..., pk ) est entièrement déterminée par les valeurs des probabilités de chacun des k-uplets possibles. Ces probabilités sont notées P{N1 = n1, ..., Nk = nk }.
Nous montrerons que :
|
|
pour tous les k-uplets appartenant au support de la distribution (et 0 sinon).
-----
Si k = 2, on retrouve la distribution binomiale.
Le terme n! / (n1!.n2!...nk!) s'appelle le "coefficient multinomial". Il est égal au nombre de "mots" que l'on peut construire à partir d'un alphabet comprenant k caractères en utilisant n1 fois le premier caractère, n2 fois le second caractère etc...
Nous justifierons ce résultat de deux façons différentes.
-----
On remarquera que le coefficient multinomial est égal au coefficient du monôme xn1xn2 ...xnk dans le développement de (x1 + x2 + ...+ xk )n, ce qui justifie le nom de la distribution.
Rappelons que Ni désigne l'effectif de la modalité n°i.
Considérons la variable Ni. A chaque lancer :
* Le résultat est la modalité i avec la probabilité pi.
* Le résultat n'est pas la modalité i (c'est à dire, est toute autre modalité) avec la probabilité (1 - pi).
La variable Ni a donc une distribution binomiale B(n, pi).
Ni étant B(n, pi), on a :
|
E[Ni] = npi |
Ni étant B(n, pi), on a :
|
Var(Ni) = n.pi(1 - pi) |
Nous donnerons deux démonstrations du résultat suivant :
|
Cov(Ni , Nj ) = -n pi pj |
Les covariances sont toute négatives : le nombre de tirages n étant fixe, toute augmentation de ni s'accompagnera, en moyenne, d'une diminution des effectifs des autres modalités, et donc de nj.
Nous donnons également ici une troisième démonstration de ce résultat en ayant recours au Théorème de l'Espérance Itérée.
-----
En raison de la contrainte qui lie les variables Ni :
Si Ni = n
la matrice de covariance de la distribution multinomiale n'est pas de rang k mais de rang k - 1.
En se rapportant à la définition du coefficient de corrélation de deux variables, nous avons :
|
|
On remarquera que n ne figure plus dans cette expression.
Divisons l'ensemble des variables {Ni} en deux groupes. Pour la simplicité des notations, soit k' un entier inférieur à k, et considérons :
* Un premier groupe constitué des k' premières variables {N1, N2 , ..., Nk'}.
* Un deuxième groupe de variables consitué des k' - k dernières variables {Nk'+1, Nk'+2 , ..., Nk}.
Nous imposons la condition N1+ N2 + ...+ Nk' = z (et donc Nk'+1+ Nk'+2 + ...+ Nk = n - z). Autrement dit, nous ne considérons que les suites de lancers pour lesquelles N1+ N2 + ...+ Nk' = z, et ignorons les autres.
Alors on montre que la distribution conjointe des {N1, N2 , ..., Nk'} conditionnellement à N1+ N2 + ...+ Nk' = z est la distribution multinomiale Mult(z, p'1, p'2 , ..., p'k') avec :
p'i = pi /(p1+ p2 + ... + pk')
avec un résultat similaire pour le deuxième groupe de variables.
La fonction génératrice des moments de la distribution multinomiale Mult(n, p1, p2 , ..., pk ) est :
|
|
Soit X = {X1, X2, ..., Xk} un ensemble de k v.a. distribuées selon la distribution multinomiale Mult(n, p1, p2 , ..., pk ).
Alors X* = {X1 + X2, ..., Xk} est un ensemble de (k - 1) v.a. distribuées selon Mult(n, p1+ p2 , ..., pk ).
Pourquoi ?
Ce résultat se généralise facilement à tout partitionnement de l'ensemble des variables initiales en sous-groupes.
Il existe un lien intime entre la distribution multinomiale et la distribution de Poisson. Nous avons montré ici que si {N1, N2, ..., Nk} sont k variables de Poisson indépendantes (mais dont les distributions ne sont pas nécessairement identiques), alors la distribution conjointe de {N1, N2, ..., Nk} conditionnellement à leur somme est une distribution multinomiale.
_____________________________________________________
|
Tutoriel 1 |
Nous calculons ici la distribution de probabilité de la distribution multinomiale. Celle-ci repose en partie sur le coefficient multinomial, dont nous établissons l'expression par deux méthodes différentes.
DISTRIBUTION DE PROBABILITE DE LA DISTRIBUTION MULTINOMIALE
|
Distribution de probabilité Le coefficient multinomial Première démonstration Deuxième démonstration |
||
|
TUTORIEL |
||
__________________________________
|
Tutoriel 2 |
Nous calculons ici par deux méthodes différentes la covariance des effectifs de deux modalités d'une distribution multinomiale. La seconde méthode fait appel à une représentation des effectifs d'une modalité comme somme de variables de Bernoulli, technique qui s'avère être utile dans de nombreux problèmes touchant aux distributions discrètes (voir par exemple le calcul de la moyenne de la distribution hypergéométrique).
Rappelons que nous donnons également ici une troisième démonstration de ce résultat en ayant recours au Théorème de l'Espérance Itérée.
COVARIANCES DE LA DISTRIBUTION MULTINOMIALE
|
Calcul direct de la covariance Deuxième démonstration par variables indicatrices Effectif d'une modalité comme somme de variables de Bernoulli Calcul de la covariance |
||
|
TUTORIEL |
||
______________________________________________________
Voir aussi: