Changement, transformations et fonctions de variables aléatoires
Lorsqu'on étudie la densité de probabilité
(ddp) d'une variable aléatoire X, on est souvent amené à créer une nouvelle variable Y définie comme une fonction f(X) de la variable
initiale X. Par exemple, on sait que si X~N(µ,
²), alors la nouvelle variable :
Y = f(X) = (X - µ)/![]()
est N(0, 1).
De même, la grandeur dont on cherche la distribution
peut être une fonction d'une autre grandeur dont on connait la distribution.
Voici quelques exemples:
* Changement d'échelle: passer
des degrés aux radians, des kilomètres aux miles, des années-lumière aux parsecs,
des degrés centigrades aux degrés Farenheit, d'une échelle linéaire à une échelle
logarithmique, de
à
la distribution de la variance (voir ici).
* Lois physiques: quelle est la distribution de l'énergie cinétique des molécules d'un gaz, connaissant la distribution des vitesses de ces molécules ?
Dans sa généralité, la question est:
* Si Y = h(X),
* et si f(x) est la distribution de X,
alors quelle est la distribution g(y) de Y ?
Le problème se généralise au cas où une ou plusieurs variables Yj sont définies à partir de plusieurs variables Xi par une transformation y = h(x). Voici quelques exemples.
Soit
f(x, y) est la densité de probabilité conjointe de la paire
de variables aléatoires {X, Y} dans le repère cartésien {x, y}.
Chaque point (x, y) du plan peut être également identifié par
ses coordonnées polaires (r,
). Chaque tirage
de la paire {X, Y} produit donc une paire de valeurs de r
et de
, définissant ainsi deux nouvelles v.a.
R et
.
Quelle est la distribution conjointe de R et
de
? Quelles sont les distributions (marginales)
de R et de
?
Si f(x) est la ddp de la variable aléatoire X, et si Z1 = z1(x1, x2 , ..., xn) est une statistique (par exemple, la moyenne empirique), quelle est la ddp de Z1 ?
La statistique Z1 est une fonction de n variables Xi (où n est la taille de l'échantillon) indépendantes et identiquement distribuées, toutes de ddp f(x). S'il est possible de définir n-1 autres statistiques indépendantes Zi, i = 2, .., n, alors une transformation Z = h(X) est définie, et g(z), la distribution conjointe de Z = {Z1, Z2, ..., Zn} peut être calculée. La ddp de la statistique Z1 est alors la distribution marginale de Z après intégration de g(z) sur zi, i = 2, .., n.
Les calculs sur les distributions conjointes de plusieurs v.a. impliquent souvent des intégrales multiples dont les bornes sont des variables. Un changement de variable approprié permet parfois de transformer toutes ces bornes variables, sauf une, en bornes fixes, ce qui facilite grandement le calcul de l'intégrale multiple.
* Certaines distributions classiques sont naturellement définies comme le rapport de deux variables aléatoires (T de Student, F de Fisher (-Snedecor), distribution de Cauchy comme rapport de deux variables normales standard). Un changement de variable approprié permet alors souvent de calculer une forme explicite des ddp de ces variables.
* Lorsque le calcul d'une distributions s'avère difficile par une approche directe, il est parfois plus facile de la considérer comme une distribution marginale de la distribution conjointe d'un ensemble de variables judicieusement choisies. Le calcul de cette distribution conjointe passe alors toujours par une étape de transformations de variables aléatoires.
______________________________________________________________________________
|
Tutoriel 1 |
Nous présentons ici quelques exemples simples de fonctions univariées de variables aléatoires. Nous n'avons recours à aucune théorie générale : chaque nouveau problème est résolu à partir des seules propriétés de la fonction de répartition.
Nous illustrons ces résultats par des exemples classiques montrant l'utilité de la notion de fonction de variables aléatoire.
PREMIERS EXEMPLES DE FONCTIONS
DE VARIABLES ALEATOIRES
|
Fonction linéaire d'une variable aléatoire Translation Changement d'échelle Transformation linéaire générale Exemple: distribution de la variance d'un échantillon normal Carré d'une variable aléatoire Théorie Exemple 1: distribution Exemple 2: le carré d'une Student Tn est une Fisher F1,n Racine carrée d'une variable aléatoire Théorie Exemple: distribution de l'écart-type empirique d'une distribution normale standard Inverse d'une variable aléatoire Théorie Exemple: inverse d'une variable de Cauchy |
||
|
TUTORIEL |
||
________________________________________________________________________________
|
Tutoriel 2 |
Nous élaborons ici une théorie générale des transformations univariées de variables aléatoires, que nous illustrons par des exemples. Les résultats trouvés sont un premier pas vers la notion de déterminant jacobien, qui sera au centre des transformations multivariées du Tutoriel suivant.
TRANSFORMATIONS UNIVARIEES
|
Présentation de la méthode générale Fonction de répartition de Y Transformation monotone Transformation non monotone Distribution de Y Transformation monotone croissante Transformation monotone décroissante Cas général Exemples Exemple 1 Exemple 2 Exemple 3: distribution de Cauchy Exemple 4: création d'une distribution uniforme Transformation par Fonction de Répartition |
||
|
TUTORIEL |
||
__________________________________________________
|
Tutoriel 3 |
L'étude des transformations multivariées est à la fois plus riche et plus complexe que celle des distibutions univariées. Elle repose sur la notion de déterminant jacobien d'une transformation, notion essentielle de la théorie des intégrales multiples. Nous ne pouvons aborder cette théorie dans ce Glossaire, mais nous rappelons ici le résultat principal, que l'on peut utiliser tel quel dans tout problème de transformation multivariée.
Dans le cas des transformations bivariées, il est cependant possible de justifier simplement le rôle du déterminiant jacobien et d'en donner une interprétation géométrique, ce que nous faisons ici.
Les deux Tutoriels suivants seront consacrés à des applications particulièrement importantes des transformations multivariées.
TRANSFORMATIONS MULTIVARIEES
|
Transformations bivariées Transformations univoques Jacobien Transformations non univoques Exemples Exemple 1 Exemple 2: création de variables indépendantes Exemple 3: création d'une variable uniformément distribuée Exemple 4 : Coordonnées polaires Transformations multivariées Changement de n variables en n nouvelles variables Changement de n variables en m < n nouvelles variables |
||
|
TUTORIEL |
||
_________________________________________________________
|
Tutoriel 4 |
Si X1 et X2 sont deux v.a. dont les distributions sont connues, quelle est la distribution de X = X1 + X2 ?
Une première approche est le recours à la fonction génératrice des moments. Mais cette méthode est limitée pour deux raisons :
* Les fgm doivent exister (ce qui n'est pas toujours le cas, voir distribution de Cauchy).
* La connaissance d'une fgm ne permet pas toujours de remonter à la distribution correspondante.
Ces deux difficultés sont contournées par l'utilisation
de la fonction caractéristique, plus puissante que la fgm, mais qui n'est pas
(encore !) abordée dans ce Glossaire.
* La seconde approche consiste à effectuer une transformation bivariée simple, qui conduit facilement au résultat : la distribution de X est le produit de convolution des distributions de X1 et de X2. Ce problème simple est l'archétype de tout une série de problèmes où la distribution recherchée apparaît comme une distribution marginale d'une distribution multivariée construite artificiellement à partir des variables initiales.
Nous illustrons ce résultat important par des exemples classiques. En particulier, nous montrons que la moyenne empirique de la distribution de Cauchy a pour distribution cette même distribution de Cauchy, et ce quelle que soit la taille de l'échantillon. Ce résultat étonnant est intimement lié au fait que la distribution de Cauchy n'a ni moyenne ni variance, et qu'elle échappe à l'emprise du Théorème Central Limite (voir animation interactive).
SOMME DE VARIABLES ALEATOIRES INDEPENDANTES
|
Rappel: fonction génératrice des moments Théorie Exemples Exemple 1: somme de deux variables exponentielles Exemple 2: somme de deux variables uniformément distribuées Exemple 3: distribution de la moyenne empirique de la distribution de Cauchy |
||
|
TUTORIEL |
||
_____________________________________________________________________
|
Tutoriel 5 |
Nous abordons enfin la question de la distribution du rapport Z de deux variables aléatoires X et Y (Z = X/Y). L'approche générale reprend les grandes lignes du Tutoriel précédent, avec toutefois une complication supplémentaire liée au fait qu'il arrive parfois que la variable Y (dénominateur) puisse prendre la valeur 0 dans son domaine. C'est en particulier le cas de la distribution de Cauchy, dont nous montrons ici qu'elle peut être définie comme la distribution du rapport de deux variables normales standard indépendantes (voir également animation).
Deux autres distributions classiques sont également définies comme le rapport de deux v.a. indépendantes :
* La distribution F de Fisher,
* et la distribution t de Student,
dont nous calculons ici les expressions explicites.
Nous calculons ici la
distribution t par une méthode plus directe mais plus laborieuse.
RAPPORT DE DEUX VARIABLES
ALEATOIRES INDEPENDANTES
|
Théorie Le jacobien Le dénominateur ne s'annule pas Le dénominateur s'annule Exemples T de Student F de Fisher-Snedecor Distribution de Cauchy |
||
|
TUTORIEL |
||
______________________________________________________
Voir aussi: