Multinomiale  (Distribution, ou loi)

Définition de la distribution multinomiale

La distribution binomiale B(n, p) est obtenue en considérant une suite de n tirages indépendants au jeu de Pile ou Face, p étant la probabilité de tirer Pile.

La distribution multinomiale est une généralisation de la distribution binomiale au cas où chaque "lancer" peut produire non pas deux, mais plus de deux résultats différents. Par exemple, on pourra imaginer une suite de n lancers d'un "dé" à k faces, la face n°i ayant la probabilité pi de sortir.

Un distribution multinomiale  est donc caratérisée par la donnée de :

    * n, le nombre de lancers.

    * La suite {p1, p2 , ..., pk}       avec       p1p2 + ...,  pk = 1

-----

A la suite de n lancers, nous désignerons par ni le nombre de lancers ayant produit le résultat n°i. Nous avons donc n1n2 + ...,  nk = n. Les lancers étant aléatoires, les ni sont des réalisations de k variables aléatoires que nous noterons Ni  (i = 1, 2, ..., k). Ces variables ne sont pas indépendantes puisqu'elles sont liées par la relation Si Ni  = n.

On appelle distribution multinomiale Mult(n, p1, p2 , ..., pk ) la distribution conjointe des k variables aléatoires Ni. C'est donc une distribution multivariée discrète. Son support est l'ensemble des k-uplets de nombres entiers positifs ou nuls {n1n2, ...,  nk} tels que n1n2 + ...+ nk = n.

Distribution de probabilité de la loi multinomiale

La distribution Mult(n, p1, p2 , ..., pk ) est entièrement déterminée par les valeurs des probabilités de chacun des k-uplets possibles. Ces probabilités sont notées P{N1 = n1, ..., Nk = nk }.

Nous montrerons que :

 

 

 

pour tous les k-uplets appartenant au support de la distribution (et 0 sinon).

-----

Si k = 2, on retrouve la distribution binomiale.

Coefficient multinomial

Le terme n! / (n1!.n2!...nk!) s'appelle le "coefficient multinomial". Il est égal au nombre de "mots" que l'on peut construire à partir d'un alphabet comprenant k caractères en utilisant n1 fois le premier caractère, n2 fois le second caractère etc...

Nous justifierons ce résultat de deux façons différentes.

-----

On remarquera que le coefficient multinomial est égal au coefficient du monôme xn1xn2 ...xnk dans le développement de (x1 + x2 + ...+ xk )n, ce qui justifie le nom de la distribution.

Distributions marginales

Rappelons que Ni désigne l'effectif de la modalité n°i.

Distribution

Considérons la variable Ni. A chaque lancer :

    * Le résultat est la modalité i avec la probabilité pi.

    * Le résultat n'est pas la modalité i (c'est à dire, est toute autre modalité) avec la probabilité (1 - pi).

La variable Ni a donc une distribution binomiale B(n, pi).

Moyennes

Ni étant B(n, pi), on a :

E[Ni] = npi

Variance

Ni étant B(n, pi), on a :

Var(Ni) = n.pi(1 - pi)

 

Covariances

Nous donnerons deux démonstrations du résultat suivant :

 

Cov(Ni , Nj ) = -n pi pj

 

 

Les covariances sont toute négatives : le nombre de tirages n étant fixe, toute augmentation de ni s'accompagnera, en moyenne, d'une diminution des effectifs des autres modalités, et donc de nj.

 

Nous donnons également ici une troisième démonstration de ce résultat en ayant recours au Théorème de l'Espérance Itérée.

-----

En raison de la contrainte qui lie les variables Ni :

Si Ni  = n

la matrice de covariance de la distribution multinomiale n'est pas de rang k mais de rang k - 1.

Coefficient de corrélation

En se rapportant à la définition du coefficient de corrélation de deux variables, nous avons :

 

 

 

 

On remarquera que n ne figure plus dans cette expression.

Distributions conditionnelles

Divisons l'ensemble des variables {Ni} en deux groupes. Pour la simplicité des notations, soit k' un entier inférieur à k, et considérons :

    * Un premier groupe constitué des k' premières variables {N1, N2 , ..., Nk'}.

    * Un deuxième groupe de variables consitué des k' - k dernières variables {Nk'+1, Nk'+2 , ..., Nk}.

Nous imposons la condition N1+ N2 + ...+ Nk' = z (et donc Nk'+1+ Nk'+2 + ...+ Nk = n - z). Autrement dit, nous ne considérons que les suites de lancers pour lesquelles N1+ N2 + ...+ Nk' = z, et ignorons les autres.

Alors on montre que la distribution conjointe des {N1, N2 , ..., Nk'} conditionnellement à N1+ N2 + ...+ Nk' = z est la distribution multinomiale Mult(z, p'1, p'2 , ..., p'k') avec :

p'i = pi /(p1+ p2 + ... + pk')

avec un résultat similaire pour le deuxième groupe de variables.

Fonction génératrice des moments

La fonction génératrice des moments de la distribution multinomiale Mult(n, p1, p2 , ..., pk ) est :

 

 

Fusionner des modalités

Soit X = {X1, X2, ..., Xk} un ensemble de k v.a. distribuées selon la distribution multinomiale Mult(n, p1, p2 , ..., pk ).

Alors X* = {X1 + X2, ..., Xk} est un ensemble de (k - 1) v.a. distribuées selon Mult(n, p1+ p2 , ..., pk ).


Pourquoi ?

Ce résultat se généralise facilement à tout partitionnement de l'ensemble des variables initiales en sous-groupes.

Lien avec la distribution de Poisson

Il existe un lien intime entre la distribution multinomiale et la distribution de Poisson. Nous avons montré ici que si {N1, N2, ..., Nk} sont k variables de Poisson indépendantes (mais dont les distributions ne sont pas nécessairement identiques), alors la distribution conjointe de {N1, N2, ..., Nk} conditionnellement à leur somme est une distribution multinomiale.

_____________________________________________________

 

Tutoriel 1

 

Nous calculons ici la distribution de probabilité de la distribution multinomiale. Celle-ci repose en partie sur le coefficient multinomial, dont nous établissons l'expression par deux méthodes différentes.

 

 

DISTRIBUTION DE PROBABILITE DE LA DISTRIBUTION MULTINOMIALE

Distribution de probabilité

Le coefficient multinomial

Première démonstration

Deuxième démonstration

TUTORIEL

__________________________________

 

 

Tutoriel 2

 

Nous calculons ici par deux méthodes différentes la covariance des effectifs de deux modalités d'une distribution multinomiale. La seconde méthode fait appel à une représentation des effectifs d'une modalité comme somme de variables de Bernoulli, technique qui s'avère être utile dans de nombreux problèmes touchant aux distributions discrètes (voir par exemple le calcul de la moyenne de la distribution hypergéométrique).


Rappelons que nous donnons également ici une troisième démonstration de ce résultat en ayant recours au Théorème de l'Espérance Itérée.

 

 

COVARIANCES DE LA DISTRIBUTION MULTINOMIALE

Calcul direct de la covariance

Deuxième démonstration par variables indicatrices

Effectif d'une modalité comme somme de variables de Bernoulli

Calcul de la covariance

TUTORIEL

 

 ______________________________________________________

 

Voir aussi:

Distribution binomiale

Distribution de Poisson

Téléchargez ce Glossaire