Animation interactive

Hypergéometrique  (Distribution, ou loi)

Une urne contient N boules, dont :

avec B + R = N.

 

Un échantillon de n boules est tiré sans remise de l'urne. Autrement dit, n boules (l'échantillon) sont sélectionnées au hasard, puis retirées de l'urne. Le nombre de boules blanches présentes dans l'échantillon est une variable aléatoire Y, dont la distribution est connue sous le nom de distribution hypergéométrique.

Elle dépend des trois paramètres N, B et n, et sera notée HG(N, B, n).

 

Les principales caractéristiques de la distribution hypergéométrique sont :

Distibution de probabilité de la loi hypergéométrique

Notons P{Y = b} la probabilité pour que l'échantillon contienne exactement b boules blanches. Nous montrerons que :

 

 

 

 

avec   max(0, n-R)   b   min(B, n).

Moyenne

La moyenne de la distribution hypergéométrique est :

 

 

 

Si l'on note p la proportion initiale de boules blanches dans l'urne, cette expression s'écrit :

µ = np

Variance

La variance de la distribution hypergéométrique est :

 

 

 

Si l'on note p la proportion initiale de boules blanches dans l'urne, cette expression s'écrit :

s² = np(1 - p)(1 - (n - 1)/(N - 1))

 

Remarquez que, pour une valeur de p donnée, s² converge vers np(1 - p), la variance de la distribution binomiale de paramètres (n, p), quand le nombre initial de boules N tend vers l'infini. Pouvez-vous expliquer pourquoi ce résultat devait être attendu ?

Animation interactive

 

 __________________________________________________________________

 

 

Tutoriel 1

 

Ces résultats sont démontrés dans le Tutoriel suivant. Ils font largement appel à une technique que l'on retrouve souvent dans les problèmes de distributions discrètes, et qui consiste à représenter les effectifs (ici, le nombre boules blanches de l'échantillon) par des sommes de variables de Bernoulli. On retrouvera ce type d'approche par exemple dans l'étude des distributions binomiale et multinomiale.

 

 

 

DISTRIBUTION HYPERGEOMETRIQUE

Distribution de probabilité de la distribution hypergéométrique

Moyenne de la distribution hypergéométrique

Effectif comme somme de variables de Bernoulli

Calcul de la moyenne

Variance de la distribution hypergéométrique

Variance des variables de Bernoulli auxiliaires

Covariances des variables de Bernoulli auxiliaires

Variance de la distribution hypergéométrique

TUTORIEL

____________________________________________________________

 

Tutoriel 2

 

Nous présentons ensuite une situation où la distribution hypergéométrique apparait de façon un peu inattendue.

    * Soient X et Y deux variables aléatoires binomiales indépendantes, de même paramètre p, mais de tailles différentes m et n

    * Par ailleurs, soit k un entier quelconque.

 

Alors, la distribution de X, conditionnellement à la contrainte X + Y = k est une distribution hypergéométrique. Par ailleurs, cette distribution ne dépend pas de la valeur de p.

Cette importante propriété de la distribution binomiale est illustrée par une animation interactive très instructive.

 

Elle est à la base du test de Fisher-Irwin, dont l'objectif est de tester l'hypothèse H0  selon laquelle deux populations de Bernoulli ont la même valeur du paramètre p.

 

 

DISTRIBUTION DE DEUX VARIABLES BINOMIALES INDEPENDANTES

CONDITIONNELLEMENT A LEUR SOMME

Distribution de deux variables binomiales indépendantes conditionnellement à leur somme

     Animation interactive

TUTORIEL

 

_______________________________________________________

 

Voir aussi:

Distribution binomiale

Le test de Fisher-Irwin

Téléchargez ce Glossaire