|
Animation interactive |
Hypergéometrique (Distribution, ou loi)
Une urne contient N boules, dont :
avec B + R = N.
Un échantillon de n boules est tiré sans remise de l'urne. Autrement dit, n boules (l'échantillon) sont sélectionnées au hasard, puis retirées de l'urne. Le nombre de boules blanches présentes dans l'échantillon est une variable aléatoire Y, dont la distribution est connue sous le nom de distribution hypergéométrique.
Elle dépend des trois paramètres N, B et n, et sera notée HG(N, B, n).
Les principales caractéristiques de la distribution hypergéométrique sont :
Notons P{Y = b} la probabilité pour que l'échantillon contienne exactement b boules blanches. Nous montrerons que :
|
|
avec max(0, n-R)
b
min(B, n).
La moyenne de la distribution hypergéométrique est :
|
|
Si l'on note p la proportion initiale de boules blanches dans l'urne, cette expression s'écrit :
µ = np
La variance de la distribution hypergéométrique est :
|
|
Si l'on note p la proportion initiale de boules blanches dans l'urne, cette expression s'écrit :
s² = np(1 - p)(1 - (n - 1)/(N - 1))
Remarquez que, pour une valeur de p donnée, s² converge vers np(1 - p), la variance de la distribution binomiale de paramètres (n, p), quand le nombre initial de boules N tend vers l'infini. Pouvez-vous expliquer pourquoi ce résultat devait être attendu ?
|
Animation interactive |
__________________________________________________________________
|
Tutoriel 1 |
Ces résultats sont démontrés dans le Tutoriel suivant. Ils font largement appel à une technique que l'on retrouve souvent dans les problèmes de distributions discrètes, et qui consiste à représenter les effectifs (ici, le nombre boules blanches de l'échantillon) par des sommes de variables de Bernoulli. On retrouvera ce type d'approche par exemple dans l'étude des distributions binomiale et multinomiale.
DISTRIBUTION HYPERGEOMETRIQUE
|
Distribution de probabilité de la distribution hypergéométrique Moyenne de la distribution hypergéométrique Effectif comme somme de variables de Bernoulli Calcul de la moyenne Variance de la distribution hypergéométrique Variance des variables de Bernoulli auxiliaires Covariances des variables de Bernoulli auxiliaires Variance de la distribution hypergéométrique |
||
|
TUTORIEL |
||
____________________________________________________________
|
Tutoriel 2 |
Nous présentons ensuite une situation où la distribution hypergéométrique apparait de façon un peu inattendue.
* Soient X et Y deux variables aléatoires binomiales indépendantes, de même paramètre p, mais de tailles différentes m et n
* Par ailleurs, soit k un entier quelconque.
Alors, la distribution de X, conditionnellement à la contrainte X + Y = k est une distribution hypergéométrique. Par ailleurs, cette distribution ne dépend pas de la valeur de p.
Cette importante propriété de la distribution binomiale est illustrée par une animation interactive très instructive.
Elle est à la base du test de Fisher-Irwin, dont l'objectif est de tester l'hypothèse H0 selon laquelle deux populations de Bernoulli ont la même valeur du paramètre p.
DISTRIBUTION DE DEUX VARIABLES BINOMIALES INDEPENDANTES
CONDITIONNELLEMENT A LEUR SOMME
|
Distribution de deux variables binomiales indépendantes conditionnellement à leur somme
|
||
|
TUTORIEL |
||
_______________________________________________________
Voir aussi: