Box-Muller (Transformation de)
La méthode la plus populaire de simulation d'une variable normale.
L'universalité de la distribution normale rend impérieux le besoin de la simuler. La méthode la plus directe pour simuler une variable aléatoire est de recourir à la Transformation par Fonction de répartition (TFR). Rappelons que la TFR utilise la fonction réciproque de la fonction de répartition, et que cette dernière doit donc être connue de façon explicite.
La fonction de répartition de la distribution normale est

qui est tabulée avec une très grande précision, mais qui ne peut pas s'exprimer à l'aide de fonctions usuelles (logarithme, exponentielle, fonctions trigonométriques etc...).
La transformation de Box-Muller contourne cette difficulté d'une façon très astucieuse décrite dans le Tutoriel ci-dessous. Le résultat final est le suivant :
|
* Si U1 et U2 sont deux variables indépendantes uniformément distribuées dans [0, 1]. * Alors les deux variables aléatoires X et Y définies par
sont deux variables normales standard indépendantes.
|
Il est remarquable qu'il soit ainsi possible de simuler une variable normale en n'utilisant que des variables uniformes et des formules sans relation apparente avec la distribution normale.
Toutes les variables normales simulées sur ce site le sont par la transformation de Box-Muller.
-----
Une amélioration de la transformation de Box-Muller, parfois appelée "méthode de Marsaglia", est également décrite dans le Tutoriel ci-dessous.
En se reportant aux propriétés des transformations linéaires de variables aléatoires, le lecteur montrera facilement que deux variables normales indépendantes X et Y de distribution commune N(µ, σ²) peuvent être simulées par
|
|
Soit x un vecteur aléatoire suivant une distribution normale multivariée. Comment simuler x ?
Nous avons mentionné que la transformation de Mahalanobis est particulièrement utile pour transformer une distribution multinormale quelconque en la distribution multinormale standard. La transformation de Box-Muller peut alors être utilisée par simuler les variables marginales de cette distribution (qui sont indépendantes), et donc pour simuler un vecteur multinormal standard. La transformation de Mahalanobis inverse transforme alors ce vecteur simulé dans un vecteur aléatoire ayant la distribution multinormale souhaitée.
Plus précisément, nous montrons ici que l'ingrédient essentiel de la transformation de Mahalanobis est une matrice G telle que
Σ = GG'
où Σ est la matrice de covariance de la distribution multinormale. Une telle matrice est appelée "racine carrée" d'une matrice définie positive.
G peut être choisie d'une infinité de façons différentes, mais il est habituel de considérer que G est l'unique racine carrée symétrique de Σ. Bien que ce choix soit nécessaire lorsque l'on étudie, par exemple, la distribution de la distance de Mahalanobis, il n'est pas obligatoire pour notre propos. En fait, d'un point de vue calculatoire, il est plus pratique de choisir G comme résultant de la factorisation de Cholesky de Σ.
_______________________________________________________________
|
Tutoriel |
Dans ce Tutoriel, nous commençons par rappeler au lecteur la méthode que nous avons utilisée pour calculer le coefficient de normalisation de la distribution normale. Cette méthode est en effet le point de départ de l'élaboration de la transformation de Box-Muller, car elle montre que certains problèmes relatifs à la distribution normale sont plus facilement résolus en considérant dans un premier temps un problème similaire relatif à la distribution normale bivariée.
De fait, il apparaîtra que la transformation de Box-Muller revient à simuler la transformation binormale standard en coordonnées polaires.
-----
Nous décrivons ensuite une amélioration de la méthode de Box-Muller parfois appelée "méthode de Marsaglia" dont l'objectif est d'éviter d'avoir à calculer les sinus et cosinus que l'on trouve dans la méthode originale. Le prix à payer pour cette réduction de la charge de travail du processeur est qu'environ 21% des tirages doivent être rejetés comme impropres à la simulation. Le résultat global est néanmoins une accélération de la transformation de Box-Muller.
TRANSFORMATION DE BOX-MULLER
|
Coefficient de normalisation de la distribution normale Interprétation probabiliste : simulation d'une v.a. binormale Coordonnées cartésiennes Coordonnées polaires Indépendance des coordonnées polaires Fonction de répartition de la coordonnée radiale Transformation de Box-Muller Méthode de Marsaglia Principe de la méthode Ce qui est gagné Ce qui est perdu |
||
|
TUTORIEL |
||
____________________________________________________________
Voir aussi :