Animation interactive

Marginale  (Distribution)

Soient X et Y deux variables aléatoires, et p(x, y) leur distribution de probabilité conjointe.

Par définition, la distribution marginale de X est simplement la distribution de X, la variable Y étant ignorée (avec une définition similaire pour Y).

-----

La raison pour laquelle ce concept a été imaginé est qu'il arrive fréquemment que la distribution conjointe de la paire {X, Y} soit connue, alors que les distributions individuelles de X et de Y ne le sont pas. Mais il est alors possible de calculer ces distributions individuelles à partir de la distribution conjointe comme nous le montrons maintenant (et comme illustré dans l'animation ci-dessous).


Un bel exemple d'une telle situation se rencontre dans le calcul de la fonction génératrice d'une somme aléatoire.

Cas discret

Supposons que X et Y soient des variables discrètes. Leur distribution conjointe est :

p(xi, yj ) = P{X = xi, Y = yj }

Quelle est la distribution marginale de X ?

X = xi si et seulement si un de ces évènements mutuellement exclusifs se produit :

    * {xi et y1}

    * {xi et y2}

    * {xi et y3}

    * ------

La probabilité P{X = xi}est alors la somme des probabilités de ces évènements, et nous avons :

 

P{X = xi}= j p(xi, yj )

 

 

Si les p(xi, yj ) = pij sont disposées selon un tableau rectangulaire, P{X = xi} est la somme des éléments de la ligne n°i. Elle est souvent notée pi..

Alors les pi. = P{X = xi} peuvent être visualisés comme étant écrits dans la marge de droite du tableau, d'où le nom de distribution "marginale".

 

 

De même, P{Y = yj } = p.j est la somme des probabilités figurant dans la colonne n°j.


L'image ci-dessus suppose que X peut prendre n valeurs et que Y peut prendre m valeurs, mais le résultat précédent s'applique également si X ou Y (ou les deux) prennent une infinité (dénombrable) de valeurs, comme c'est le cas par exemple pour des variables de Poisson ou binomiale négative.

Cas continu

Supposons maintenant que X et Y soient toutes deux des variables continues et que leur distribution conjointe puisse être représentée par la densité f(x, y). Un argument informel calqué sur le cas discret peut être développé comme suit :

 

 

La probabilité pour qu'une réalisation de (X, Y) soit égale à (x, y) à dx et dy près est égale à f(x, y).dxdy. Pour une valeur donnée de x, la probabilité pour que X soit égale à x à dx près est égale à la somme sur y de ces probabilité infinitésimales. La densité marginale de X, soit fX (x), est donc donnée par :

 

 

 

avec un résultat similaire pour Y.

-----
Il est également possible de calculer une distribution marginale en faisant appel aux propriétés de la fonction génératrice des moments multivariée (voir ici).

Le cas multivarié

Nous avons décrit les distributions marginales d'une distribution bivariée, mais le concept se généralise à des distributions comportant un nombre quelconque de variables.

Soit x = {X1, X2, ..., Xp} un ensemble de p variables aléatoires de distribution de probabilité conjointe p(x1, x2, ..., xp). Alors, à tout sous-ensemble de cet ensemble de variables on fait correpondre une distribution marginale de p(x1, x2, ..., xp). Cette distribution est la distribution conjointe de ces variables, les autres variables de l'ensemble étant ignorées.

Une distribution p-variée a donc 2p - 1 distributions marginales (en omettant les ensembles complet et vide de variables).

    * Les plus connus de ces distributions marginales sont celles de la distribution normale multivariée.

    * Nous calculons ici la densité de probabilité conjointe de deux statistiques d'ordre. Cette distribution conjointe est une des distributions marginales de la distribution conjointe de l'ensemble des statistiques d'ordre.

Les distributions marginales ne caractérisent pas une distribution multivariée

Beaucoup de distributions multivariées peuvent avoir le même ensemble de distributions marginales. Ainsi :

    * Nous savons que les marginales d'une distribution normale bivariéee standard sont des variables normales standard.

    * Mais nous donnons ici deux exemples de distributions bivariées dont les marginales sont également des variables normales standard, mais qui ne sont pas des distributions normales bivariées.

-----

La connaissance des distributions marginales d'une distribution multivariée n'est donc pas suffisante pour connaître cette distribution multivariée. La raison en est que la seule connaissance des marginales ne dit rien sur les couplages entre ces marginales : seule la distribution conjointe complète rend compte de ces couplages.

Distributions marginales et indépendance

La règle précédente comporte une exception très importante. On montre que :

    * Si les variables X et Y sont indépendantes, alors leur distribution de probabilité conjointe est égale au produit des distributions (marginales) de ces deux variables.

    * Réciproquement, si une distribution conjointe est égale au produit de ses distributions marginales, alors les variables marginales correspondantes sont indépendantes.

 

 

f(x, y) = fX (x) fY (x)   ssi    X et Y sont indépendantes

 

 

Ce résultat conduit à une méthode très puissante de démonstration de l'indépendance de deux variables aléatoires. Il se généralise à un nombre quelconque de variables.

Animation

Il arrive souvent que la méthode la plus pratique pour le calcul de la distribution d'une v.a. A consiste à :

    * Dans un premier temps, calculer la distribution conjointe de A et d'une autre v.a. B judicieusement choisie.

    * Puis de considérer la distribution de A comme une des deux distributions marginales de cette distribution conjointe.

 

Nous illustrons cette méthode indirecte mais puissante par l'animation suivante.

_______

Soient X et Y deux variables indépendantes suivant toutes deux la distribution uniforme dans [0, 1].

On considère les deux problèmes suivant, apparemment difficiles et sans lien entre eux :

    1) Quelle est la distribution de la v.a. U = X/Y ?

    2) Quelle est la distribution de la v.a. V = XY ?

 

Dans le Tutoriel ci-dessous, nous montrons que la réponse sera obtenue :

    * En calculant dans un premier temps la distribution conjointe de {U, V},

    * Puis en calculant la distribution de U = X/Y  comme une des deux distributions marginales de cette distribution conjointe, avec une approche similaire pour V = XY.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

 

* Cliquez à plusieurs reprises sur "Next". Chaque clic provoque le tirage d'une paire de valeurs de {X, Y}, qui est ensuite affichée sous la forme d'une paire de valeurs de {U, V} (point rouge dans le cadre principal).

* La courbe rouge dans le cadre gris inférieur représente la densité marginale de la v.a. U (le rapport X/Y).

* La courbe rouge dans le cadre gris de gauche représente la densité marginale de la v.a. V (le produit XY).

_____________________

Cliquez sur "Go". Les observations sont maintenant tirées automatiquement de la distribution uniforme. Observez :

    * La construction progressive des histogrammes des densités de U et de V.

    * La densité conjointe de la paire {U, V}.

 

 

 

Ces résultats méritent certainement quelques commentaires, qui sont développés dans le Tutoriel ci-dessous.

_________________

Nous pouvons nous estimer heureux que notre ambitieux programme de calcul simultané des distributions de XY et de X/Y ait pu être mené à son terme. Vous pouvez également vous familiariser avec le problème en résolvant séparément, mais par la même approche générale, les deux problèmes plus simples :

    * Calculer la distribution de XY.

    * Calculer la distribution de X/Y.

Autres exemples

Vous trouverez dans ce site d'autres exemples de calcul d'une distribution en tant que distribution marginale d'une distribution conjointe, en particulier pour le calcul des densités :

    * De la distribution t de Student,

    * De la distribution F de Fisher.

______________________________________________________________

 

 

Tutoriel

 

Soient X et Y deux variables aléatoires, toutes deux uniformément distribuées dans [0, 1].

Dans ce Tutoriel, nous calculons les distributions :

    * Du rapport U = X/Y,

    * Et du produit V = XY.

 

Nous le faisons :

    * En calculant la distribution de probabilité conjointe de {U, V},

    * Puis en calculant les distributions de U et de V en tant que distributions marginales de cette distribution conjointe.

-----

Bien que les résultats soient de peu d'utilité pratique, ils sont inaccessibles à l'intuition comme le montre l'animation ci-dessus, et n'auraient probablement pas pu être obtenus par une approche plus directe.

La méthode que nous décrivons est puissante et d'un usage général. La démonstration peut être considérée comme un modèle de calcul de distribution d'une variable aléatoire lorsque des méthodes plus directes ont échoué.

 

 

 

DISTRIBUTIONS DU PRODUIT ET DU RAPPORT

DE DEUX VARIABLES UNIFORMES INDEPENDANTES

La transformation inverse

La transformation

Les limites

Limites de u

Limites de v

Le jacobien

Distribution conjointe du rapport X/Y et du produit XY

Distribution marginale du produit XY

Distribution marginale du rapport X/Y

Cas u < 1

Cas u > 1

TUTORIEL

 

_______________________________________________________

 

Voir aussi:

Transformation de variables aléatoires

Téléchargez ce Glossaire