Changement, transformations et fonctions de variables aléatoires

Transformations univariées

Lorsqu'on étudie la densité de probabilité (ddp) d'une variable aléatoire X, on est souvent amené à créer une nouvelle variable Y définie comme une fonction f(X) de la variable initiale X. Par exemple, on sait que si X~N(µ, ²), alors la nouvelle variable :

Y = f(X) = (X - µ)/

est N(0, 1).


De même, la grandeur dont on cherche la distribution peut être une fonction d'une autre grandeur dont on connait la distribution. Voici quelques exemples:

    * Changement d'échelle: passer des degrés aux radians, des kilomètres aux miles, des années-lumière aux parsecs, des degrés centigrades aux degrés Farenheit, d'une échelle linéaire à une échelle logarithmique, de à la distribution de la variance (voir ici).

    * Lois physiques: quelle est la distribution de l'énergie cinétique des molécules d'un gaz, connaissant la distribution des vitesses de ces molécules ?

 

Dans sa généralité, la question est:

    * Si Yh(X),

    * et si f(x) est la distribution de X,

 

alors quelle est la distribution g(y) de Y ?

Transformations multivariées

Le problème se généralise au cas où une ou plusieurs variables Yj sont définies à partir de plusieurs variables Xi  par une transformation y = h(x). Voici quelques exemples.

Rotation des axes

            Si f(x, y) est la densité de probabilité conjointe de la paire de variables aléatoires {X, Y}. Faisons tourner le repère {x, y}d'un angle . Les nouveaux axes {x', y'}définissent deux nouvelles variables {X', Y'}. Quelle est la densité de probabilité conjointe de {X', Y'}?

Coordonnées polaires

            Soit f(x, y) est la densité de probabilité conjointe de la paire de variables aléatoires {X, Y} dans le repère cartésien {x, y}. Chaque point (x, y) du plan peut être également identifié par ses coordonnées polaires (r, ). Chaque tirage de la paire {X, Y} produit donc une paire de valeurs de r et de , définissant ainsi deux nouvelles v.a. R et .

Quelle est la distribution conjointe de R et de  ? Quelles sont les distributions (marginales) de R et de  ?

Echantillonnage

            Si f(x) est la ddp de la variable aléatoire X, et si Z1 = z1(x1, x2 , ..., xn) est une statistique (par exemple, la moyenne empirique), quelle est la ddp de Z1 ?

La statistique Z1 est une fonction de n variables Xi (où n est la taille de l'échantillon) indépendantes et identiquement distribuées, toutes de ddp  f(x). S'il est possible de définir n-1 autres statistiques indépendantes Zi, i = 2, .., n, alors une transformation Z = h(X) est définie, et g(z), la distribution conjointe de Z = {Z1, Z2, ..., Zn} peut être calculée. La ddp de la statistique Z1 est alors la distribution marginale de Z après intégration de g(z) sur zi, i = 2, .., n.

Bornes d'intégration

             Les calculs sur les distributions conjointes de plusieurs v.a. impliquent souvent des intégrales multiples dont les bornes sont des variables. Un changement de variable approprié permet parfois de transformer toutes ces bornes variables, sauf une, en bornes fixes, ce qui facilite grandement le calcul de l'intégrale multiple.

Distributions

             * Certaines distributions classiques sont naturellement définies comme le rapport de deux variables aléatoires (T de Student, F de Fisher (-Snedecor), distribution de Cauchy comme rapport de deux variables normales standard). Un changement de variable approprié permet alors souvent de calculer une forme explicite des ddp de ces variables.

            * Lorsque le calcul d'une distributions s'avère difficile par une approche directe, il est parfois plus facile de la considérer comme une distribution marginale de la distribution conjointe d'un ensemble de variables judicieusement choisies. Le calcul de cette distribution conjointe passe alors toujours par une étape de transformations de variables aléatoires.

 

______________________________________________________________________________

 

Tutoriel 1

 

Nous présentons ici quelques exemples simples de fonctions univariées de variables aléatoires. Nous n'avons recours à aucune théorie générale : chaque nouveau problème est résolu à partir des seules propriétés de la fonction de répartition.

Nous illustrons ces résultats par des exemples classiques montrant l'utilité de la notion de fonction de variables aléatoire.

 

 

PREMIERS EXEMPLES DE FONCTIONS

DE VARIABLES ALEATOIRES

Fonction linéaire d'une variable aléatoire

Translation

Changement d'échelle

Transformation linéaire générale

Exemple: distribution de la variance d'un échantillon normal

Carré d'une variable aléatoire

Théorie

Exemple 1: distribution 1

Exemple 2:  le carré d'une Student Tn est une Fisher F1,n

Racine carrée d'une variable aléatoire

Théorie

Exemple: distribution de l'écart-type empirique d'une distribution normale standard

Inverse d'une variable aléatoire

Théorie

Exemple: inverse d'une variable de Cauchy

TUTORIEL

________________________________________________________________________________

 

Tutoriel 2

 

Nous élaborons ici une théorie générale des transformations univariées de variables aléatoires, que nous illustrons par des exemples. Les résultats trouvés sont un premier pas vers la notion de déterminant jacobien, qui sera au centre des transformations multivariées du Tutoriel suivant.

 

 

 TRANSFORMATIONS UNIVARIEES

Présentation de la méthode générale

Fonction de répartition de Y

Transformation monotone

Transformation non monotone

Distribution de Y

Transformation monotone croissante

Transformation monotone décroissante

Cas général

Exemples

Exemple 1

Exemple 2

Exemple 3: distribution de Cauchy

Exemple 4: création d'une distribution uniforme

Transformation par Fonction de Répartition

TUTORIEL

__________________________________________________


Tutoriel 3

 

L'étude des transformations multivariées est à la fois plus riche et plus complexe que celle des distibutions univariées. Elle repose sur la notion de déterminant jacobien d'une transformation, notion essentielle de la théorie des intégrales multiples. Nous ne pouvons aborder cette théorie dans ce Glossaire, mais nous rappelons ici le résultat principal, que l'on peut utiliser tel quel dans tout problème de transformation multivariée.

Dans le cas des transformations bivariées, il est cependant possible de justifier simplement le rôle du déterminiant jacobien et d'en donner une interprétation géométrique, ce que nous faisons ici.

Les deux Tutoriels suivants seront consacrés à des applications particulièrement importantes des transformations multivariées.

 

 

 TRANSFORMATIONS MULTIVARIEES

Transformations bivariées

Transformations univoques

Jacobien

Transformations non  univoques

Exemples

Exemple 1

Exemple 2: création de variables indépendantes

Exemple 3: création d'une variable uniformément distribuée

Exemple 4 : Coordonnées polaires

Transformations multivariées

Changement de n variables en n nouvelles variables

Changement de n variables en m < n nouvelles variables

TUTORIEL

_________________________________________________________

 

Tutoriel 4

 

Si X1 et X2 sont deux v.a. dont les distributions sont connues, quelle est la distribution de X = X1X2 ?

Une première approche est le recours à la fonction génératrice des moments. Mais cette méthode est limitée pour deux raisons :

    * Les fgm doivent exister (ce qui n'est pas toujours le cas, voir distribution de Cauchy).

    * La connaissance d'une fgm ne permet pas toujours de remonter à la distribution correspondante.


Ces deux difficultés sont contournées par l'utilisation de la fonction caractéristique, plus puissante que la fgm, mais qui n'est pas (encore !) abordée dans ce Glossaire.

    * La seconde approche consiste à effectuer une transformation bivariée simple, qui conduit facilement au résultat : la distribution de X est le produit de convolution des distributions de X1 et de X2. Ce problème simple est l'archétype de tout une série de problèmes où la distribution recherchée apparaît comme une distribution marginale d'une distribution multivariée construite artificiellement à partir des variables initiales.

Nous illustrons ce résultat important par des exemples classiques. En particulier, nous montrons que la moyenne empirique de la distribution de Cauchy a pour distribution cette même distribution de Cauchy, et ce quelle que soit la taille de l'échantillon. Ce résultat étonnant est intimement lié au fait que la distribution de Cauchy n'a ni moyenne ni variance, et qu'elle échappe à l'emprise du Théorème Central Limite (voir animation interactive).

 

 

 

 SOMME DE VARIABLES ALEATOIRES INDEPENDANTES

Rappel: fonction génératrice des moments

Théorie

Exemples

Exemple 1:   somme de deux variables exponentielles

Exemple 2:  somme de deux variables uniformément distribuées

Exemple 3:  distribution de la moyenne empirique de la distribution de Cauchy

TUTORIEL

_____________________________________________________________________

  

Tutoriel 5

 

Nous abordons enfin la question de la distribution du rapport Z de deux variables aléatoires X et Y (Z = X/Y). L'approche générale reprend les grandes lignes du Tutoriel précédent, avec toutefois une complication supplémentaire liée au fait qu'il arrive parfois que la variable Y (dénominateur) puisse prendre la valeur 0 dans son domaine. C'est en particulier le cas de la distribution de Cauchy, dont nous montrons ici qu'elle peut être définie comme la distribution du rapport de deux variables normales standard indépendantes (voir également animation).

Deux autres distributions classiques sont également définies comme le rapport de deux v.a. indépendantes :

    * La distribution F de Fisher,

    * et la distribution t de Student,

dont nous calculons ici les expressions explicites.


Nous calculons ici la distribution t par une méthode plus directe mais plus laborieuse.

 

 RAPPORT DE DEUX VARIABLES

ALEATOIRES INDEPENDANTES

Théorie

Le jacobien

Le dénominateur ne s'annule pas

Le dénominateur s'annule

Exemples

T de Student

F de Fisher-Snedecor

Distribution de Cauchy

TUTORIEL

 

 ______________________________________________________

 

Voir aussi:

Déterminant jacobien

Distribution marginale

Fonction génératrice des moments

Téléchargez ce Glossaire