Fonction génératrice des moments
Toute l'information relative à une variable aléatoire X est disponible dans sa densité de probabilité (variable continue) ou distribution de probabilité (variable discrète). A partir des définitions classiques, il devrait donc être toujours possible:
* de calculer la moyenne, la variance ou des moments d'ordre supérieur de X à partir de sa d.p.,
* de calculer la distribution, par exemple, de la somme de deux variables aléatoires indépendantes X et Y dont les distributions sont connues.
En pratique, il arrive souvent que l'utilisation directe de ces définitions conduise à des calculs inextricables. Un outil peut alors être d'un grand secours : la Fonction Génératrice des Moments.
Avant de décrire la fonction génératrice des moments, il peut être utile de faire une courte digression. La difficulté que nous venons de mentionner n'est pas propre aux seules Probabilités. En fait, il n'est guère de discipline physique ou mathématique qui ne la rencontre tôt ou tard : une certaine quantité Q, liée à une fonction f, doit être calculée. Les équations sont disponibles, mais on ne leur trouve pas de solution analytique.
Une idée générale très puissante, existant sous de multiples formes, consiste alors à transformer la fonction originale f en une nouvelle fonction appropriée g, telle que des calculs relativement simples sur cette fonction transformée produisent les résultats recherchés.
On contourne donc ainsi l'obstacle éventuel du calcul direct au prix d'une transformation convenablement choisie de la fonction originale. Ce stratagème se traduit par l'illustration suivante :
L'image inférieure explicite le détour qui consiste à :
* dans un premier temps, calculer la fonction transformée g,
* puis dans un deuxième temps à effectuer les calculs appropriés sur g .
La fonction génératrice des moments est une transformée de la ddp (ou dp). Elle se définit en trois étapes :
1) On introduit un paramètre, traditionnellement noté t.
2) On crée la variable aléatoire etX,
3) On calcule l'espérance de etX, soit E[etX]. Par exemple, si X est continue, on a :

où p(x) est la densité de probabilité de X.
L'intégrale portant sur x, la variable x ne figure plus dans le résultat, qui est donc une fonction de t seulement.
Cette fonction est, par définition, la Fonction Génératrice des Moments de la variable X (ou de sa ddp p(x)). Elle sera notée MX (t), ou plus simplement M(t) s'il n'y a pas de risque de confusion.
|
MX (t) = E[etX] |
La fonction génératrice des moments ne doit pas être confondue avec la "fonction génératrice", abordée ici.
Nous énonçons ici les principales propriétés de la fonction génératrice des moments. Certaines de ces propriétés sont difficiles à démontrer et seront donc énoncées sans démonstration. Les autres seront démontrées dans le Tutoriel ci-dessous.
Toutes les distributions n'ont pas de fgm. Deux raisons peuvent empêcher une distribution d'avoir une fgm :
1) La distribution n'a pas tous ses moments. On montre que si le moment d'ordre n d'une distribution n'existe pas, alors il en est de même de tous les moments d'ordres supérieurs à n. Nous verrons qu'une propriété essentielle de la fgm, lorsqu'elle existe, et de permettre le calcul des moments de tous ordres. Donc si une distribution n'a pas tous ses moments, elle ne peut certainement pas avoir de fgm.
C'est le cas, par exemple, de la distribution tn de Student qui n'a pas moments au-delà du moment d'ordre n - 1. En particulier, si n = 1, la distribution t devient la distribution de Cauchy, qui n'a aucun moment.
2) Cela étant, une distribution peut avoir tous ses moments, et pourtant ne pas avoir de fonction génératrice des moments, la définition de la mgf conduisant alors à une valeur infinie. C'est le cas, par exemple, de la distribution lognormale.
-----
La version en nombres complexes de la fgm s'appelle la fonction caractéristique de la distribution. Contrairement à la fgm, elle existe toujours, mais en raison des difficultés de l'Analyse Complexe, elle n'est pas abordée dans ce Glossaire.
Si la v.a. X a une fgm, alors le moment d'ordre n de sa distribution est égal à la valeur de la dérivée d'ordre n de sa fgm pour t = 0.
|
|
Bien sûr, c'est de cette propriété que la fonction génératrice des moments tire son nom.
Cette propriété est très utile en pratique : elle permet fréquemment de calculer les moments d'une v.a. plus facilement que par un calcul direct. C'est le cas de pratiquement toutes les distributions classiques évoquées sur ce site (à l'exception peut-être des distributions uniforme et Beta).
|
Si
les v.a. indépendantes X1 et X2 ont
toutes deux une fgm, |
Ce résultat est à la base du calcul des distributions de nombreuses v.a. définies, ou interprétables comme des sommes de variables iid :
* Chi-2,
ainsi, bien sûr, que pour l'importante question de la distribution de la moyenne empirique d'une distribution, par exemple normale.
|
Si
deux v.a. X et Y ont des fgm identiques, |
Ce résultat, très difficile à démontrer, est d'une grande utilité pratique. En effet, une fgm n'est pas "inversible" : connaissant la forme analytique d'une fgm, on ne sait en général pas calculer la distribution dont elle est la fgm. Par contre, si l'on dispose d'une liste de correspondances entre certaines distributions et leurs fgm, on peut avoir la chance, devant une fgm fraîchement calculée, de la retrouver dans cette liste. Grâce à la proprité d'unicité, il est alors possible d'affirmer que la distribution recherchée est l'unique distribution ayant la fonction calculée comme fgm.
Nous nous servons de la propriété d'unicité à de nombreuses reprises, par exemple :
* Calcul de la distribution du Chi-2.
* Propriété d'additivité des variables binomiales, Gamma, de Poisson...
* Transformation linéaire d'une variable normale, combinaison linéaire de variables normales (voir ici).
* Identification de la distribution d'une somme de variables exponentielles iid (voir ici).
* Distribution de la somme d'une nombre aléatoire de variables exponentielles iid (voir ici).
-----
Si deux distributions ont tous leurs moments égaux, et si elles ont toutes deux une fgm, alors elles sont effectivement identiques. Mais on connait des exemples (pathologiques) de distributions non identiques ayant pourtant tous leurs moments égaux. Ces distributions n'ont évidemment pas de fgm.
Soit {Xi} une suite de v.a. de fonctions génératrices des moments respectives Mi(t). Si la suite {Mi(t)} converge vers une limite M(t), et si cette limite est la fgm d'une v.a. X, alors la suite {Xi} converge en loi vers X.
Ce résultat fondamental est difficile, et ne
sera pas démontré. Cependant, nous y ferons appel :
* Lorsque nous démontrerons
le Théorème Central Limite.
*
Pour montrer que la distribution
binomiale tend vers une distribution normale quand la taille de l'échantillon
tend vers l'infini.
*
Comme une méthode de calcul de la fonction génératrice des moments de la distribution
de Poisson.
* Pour montrer que la distribution de Poisson
tend vers une distribution normale pour les grandes valeurs du paramètre λ.
La fonction génératrice des moments se généralise au cas multivarié. Sa définition est la même que dans le cas univarié :
MX (t) = E[e t'X]
où :
* X est un vecteur aléatoire,
* et t est maintenant un paramètre vectoriel (mais la fgm reste scalaire).
Les propriétés de la fgm univariée se transposent simplement au cas multivarié. En particulier, la fgm multivariée permet de calculer les moments croisés d'une distribution multivariée. Soit X un vecteur aléatoire de dimension p, X = (X1, X2, ..., Xp). Un moment croisé de X est une quantité de la forme :
E[X1k1.X2k2....Xpkp]
avec k1 + ... + kp = k.
On montre alors que, lorsque toutes les quantités impliquées existent, on a :

une expression similaire à celle du cas univarié.
En raison de sa nature multivariée, la fgm multivariée a cependant certaines propriétés qui n'ont pas d'équivalent dans le domaine univarié. La plus importante d'entre-elles permet parfois de calculer simplement des distributions marginales.
Soit X un vecteur aléatoire partitionné selon X = (X1, X2 ). Le paramètre vectoriel est alors naturellement partitionné en t = (t1, t2 ). La fgm de X s'écrit alors :
MX (t) = MX (t1, t2 ) = E[exp(t1'X1 + t2'X2 )]
Faisons t2 = 0 dans cette expression. Nous obtenons :
MX (t1, 0) = E[exp(t1'X1 + 0)] = E[exp(t1'X1)] = MX1(t1)
qui est la fgm de X1.
La fgm d'une distribution marginale s'obtient donc très simplement à partir de la fgm d'une distribution multivariée en égalant à 0 les composantes appropriées du paramètre vectoriel t.
Nous utilisons cette propriété comme une des (nombreuses) façons de calculer les distributions marginales de la distribution normale multivariée.
Nous montrons ici que deux v.a. X et Y de fgm respectives MX (s) et MY (t) et de fgm conjointe MXY (s, t) sont indépendantes si et seulement si :
|
MXY (s, t) = MX (s)MY (t) |
__________________________________________________________________________
|
Tutoriel |
Les propriétés énoncées ci-dessus sont détaillées et certaines démontrées dans le Tutoriel suivant :
PROPRIETES DE LA FONCTION GENERATRICE DES MOMENTS
|
La fgm engendre les moments Moyenne Moment du second ordre Tous les moments Fgm de la transformée linéaire d'une v.a. Fgm d'une somme de variables indépendantes Propriété d'unicité (sans démonstration) Propriété de convergence (sans démonstration) Existence de la fgm |
||
|
TUTORIEL |
||
____________________________________________________
Voir aussi: