ANIMATION INTERACTIVE: DISTRIBUTION DE CAUCHY

 

 

L'animation interactive suivante illustre la Distribution de Cauchy.

 

 

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

 

 

Cadre supérieur

    1) Le cadre supérieur montre la source S, des trajectoires de particules, et leurs impacts sur la Droite D (échantillon). Les angles d'émission des particules par rapport à la verticale sont tirés d'une distribution uniforme entre - p/2 et + p/2 .
 

La moyenne empirique est matérialisée par un trait vertical bleu. Il est possible que certains impacts se situent hors du cadre, et donc que les trajectoires correspondantes soient incomplètes. Il est même possible que la moyenne empirique se situe en dehors du cadre (et elle n'est alors pas affichée).

Vous pouvez faire varier le nombre de "particules" avec les boutons sous "Nb Points".

 

2) Vous pouvez également illustrer l'autre définition de la distribution de Cauchy (rapport de deux variables normales standard indépendantes) en cliquant sur le bouton "Ratio of Normals".

Plutôt que de représenter deux distributions normales, chacune générant un point à chaque itération, nous utilisons une seule distribution avec laquelle nous tirons deux observations indépendantes (traits verticaux rouge et bleu). La variable suivant la distribution de Cauchy est le rapport x1/x2 des abscisses des traits rouge et bleu.


1) Quelle serait la distribution du rapport inverse x2 / x1 ?
2) Quelle serait la distribution de la variable dont la valeur serait, après chaque tirage de deux points, choisie aléatoirement entre  x1 / x2  et  x2 / x1?

 

Cadre inférieur

Le cadre inférieur montre:

    * La distribution de Cauchy (rouge),

    * Une gaussienne standard (noir) qui n'a pas de rôle fonctionnel, et est montrée simplement à titre de référence.

 

Observez la différence entre "Cauchy" et "Gaussienne". Bien que ces deux courbes se ressemblent (courbes en cloche symétriques), elles sont fondamentalement différentes:

    * La gaussienne décroit très vite lorsqu'on s'écarte de la région centrale,

    * Alors que la distribution de Cauchy décroit extrêmement lentement : elle a des "ailes" très importantes.

En termes informels, cette décroissante est la plus lente qui soit encore compatible avec une aire finie sous la courbe. En termes encore plus informels, la courbe de Cauchy réussit à être une distribution de probabilité, mais d'extrême justesse.

 

En raison de la lenteur de cette décroissance, la distribution de Cauchy n'a pas de moyenne (ni a fortiori de variance et de moments d'ordre supérieur).


D'autres distributions classiques n'ont pas de moyenne, par exemple les distributions de Fisher Fn, 1 et Fn, 2.

La conséquence la plus frappante de cette absence de moyenne est que nous ne sommes plus dans les conditions de validité du Théorème Central Limite. Il n'est plus garanti que la distribution de la moyenne empirique tende vers une distribution normale pour des échantillons de plus en plus grands, ni que sa variance (à supposer qu'elle existe) tende alors vers 0.  En fait, malgré la symétrie de la distribution de Cauchy, la moyenne empirique n'est pas un "estimateur correct" de la médiane de la distribution.

 

L'objectif premier de cette animation est d'illustrer expérimentalement cette question.

    1) Dans l'option "Tangent" (option par défaut), choisissez "1" pour le nombre de points, et cliquez sur "Go". Observez la construction progressive de la    distribution de Cauchy.

    2) Après avoir cliqué sur "Reset", choisissez maintenant un  nombre de points quelconque. Observez que l'affichage de la distribution de Cauchy n'est pas modifié quand vous changez le nombre de points. Après avoir cliqué sur "Go", l'animation va construire la distribution de la moyenne empirique pour le nombre de points que vous avez choisi. Vous serez rapidement convaincu que cette distribution ne dépend pas du nombre de points. En fait, elle est toujours identique à la distribution de Cauchy originale (voir ici).

Donc non seulement la distribution de la moyenne empirique ne devient pas gaussienne pour les grands échantillons, mais elle n'a ni moyenne ni variance. Toute mesure raisonnable de la "dispersion" de cette distribution (comme par exemple la largeur à mi-hauteur) reste toujours la même quelle que soit la taille de l'échantillon.


Il existe des distributions aux comportements encore plus extrêmes que celui de la distribution de Cauchy, et pour lesquelles la "dispersion" (on ne peut pas parler de variance) de la distribution de la moyenne empirique augmente avec la taille de l'échantillon.

________

 

Pour l'option "Ratio of Normals", il n'y a pas de paramètre de réglage. Cliquez sur "Go", et observez la construction de la distribution du rapport de deux variables normales standard indépendantes.

Pour une démonstration, voir ici.

Téléchargez ce Glossaire