|
Animation interactive |
Binormale (Distribution)
Si vous n'êtes pas familiarisé avec la distribution normale (univariée), nous vous suggérons de vous reporter ici dans un premier temps.
-----
La distribution normale multivariée est de loin la plus utilisée dans les applications de modélisaton classiques (p. ex. Analyse Discriminante), qui font souvent appel explicitement à l'hypothèse de multinormalité des distributions rencontrées.
Lorsque seulement deux variables sont concernées, la distribution normale multivariée prend le nom de distribution normale bivariée, ou binormale. Par exemple, la distribution conjointe de la taille et du poids des individus dans une population relativement homogène est approximativement binormale.
La distribution normale (univariée) standard N(0, 1) joue un rôle central dans l'étude de la distribution normale générale, car toute distribution normale peut se ramener à cette distribution de référence par une transformation linéaire.
De façon similaire, nous commencerons notre étude de la distribution normale bivariée par celle de la distribution normale bivariée standard, qui est illustrée par l'animation ci-dessous.
Celle-ci montre deux distributions normales (univariées), représentées par deux gaussiennes, l'une horizontale, et l'autre verticale, toutes deux initialement centrées et de variance unité. Ces gaussiennes standard sont les distributions marginales de la distribution binormale standard.
Le coefficient de corrélation de ces deux variables normales est ajustable par le curseur sur fond bleu. A chaque valeur du coefficient de corrélation correspond une distribution normale bivariée standard particulière. Ainsi, alors que la distribution normale (univariée) standard est unique, il existe une famille de distributions normales bivariées standard, cette famille étant indexée par le coefficient de corrélation des deux variables marginales de la distribution.
L'ellipse est l'ensemble des points de densité 1.
* Cette ellipse se réduit à un cercle lorsque les deux variables marginales sont décorrélées.
* Son grand axe est toujours à 45° des axes portant les distributions marginales. Cet axe est dans les 1er et 3ème quadrants quand le coefficient de corrélation est positif, dans les deux autres quadrants lorsque le coefficient de corrélation est négatif.
-----
Cliquez sur "Go" et observez la répartition dans le plan des observations d'une distribution binormale standard. Le coefficient de corrélation peut être modifié sans interrompre l'animation.
Dans le Tutoriel ci-dessous, nous établissons la forme analytique g(x, y) de la distribution normale bivariée standard :
|
|
ainsi que la distribution conditionnelle g(Y | X = x0). Ce dernier résultat sera obtenu très simplement, et sera retrouvé, de façon un peu plus complexe, dans le cas de la distribution normale bivariée générale.
Dans l'animation ci-dessus, les écart-types des distributions marginales sont ajustables au moyen des deux curseurs sur fond jaune. Ces réglages permettent de découvrir d'autres distributions binormales, qui ne sont alors plus standard (les variances des distributions marginales ne sont plus égales à 1), mais qui peuvent s'y ramener par une transformation linéaire.
L'ellipse isodensité n'est en général plus orientée à 45° des axes, sauf si les variances des deux distributions marginales sont égales. Ses axes sont confondus avec les axes de la figure si et seulement si les deux variables sont décorrélées.
La distribution binormale la plus générale est obtenue en décentrant la distribution ci-dessus par une translation arbitraire dans le plan. Cette possibilité n'est pas implémentée dans l'animation.
-----
Soient donc les deux variables X et Y (qu'on ne suppose pas initialement normales) :
* de moyennes respectives µx et µy,
* et de variance respectives
x² et
y².
Par définition, la distribution conjointe de la paire (X, Y) est une distribution normale bivariée g(x, y) si la distribution conjointe des deux variables standardisées :


est une distribution binormale standard.
Nous montrerons que cette distribution est :
|
|
qui, malgré son aspect impressionnant, n'est qu'une légère complexification de la distribution binormale standard. On retrouve d'ailleurs celle-ci en égalant les moyennes à 0 et les variances à 1.
Notons qu'en raison de l'invariance du coefficient
de corrélation sous l'effet d'une transformation linéaire,
est aussi bien le coefficient de corrélation de la paire (X, Y) que celui
de la paire standardisée (X ', Y ').
Nous montrerons également que les variables X et Y sont alors obligatoirement normales, et nous calculerons les paramètres de leurs distributions.

Cette illustration montre une distribution normale bivariée générale.
Pour une valeur arbitraire x0, on trace la droite verticale x = x0, et on relève les valeurs de la densité le long de cette droite. On normalise ces valeurs de façon à ce que l'aire sous la courbe (rouge) ainsi tracée soit égale à 1.
Par définition, le résultat est la densité de Y conditionnellement à X = x0.
-----
Nous montrerons les points fondamentaux suivants :
1) Cette distribution conditionnelle est une distribution normale.
2) Sa variance Var(Y | X = x0 ) est toujours la même, quelle que soit la valeur choisie pour x0. Cette valeur est :
|
Var(Y
| X
= x0) = (1 - |
On remarquera que cette variance :
* Ne dépend effectivement pas de x0. Toutes les "coupes verticales" ont la même variance (et il en est bien sur de même pour les coupes horizontales).
* Et qu'elle est toujours inférieure à celle de Y (resp. de X), la variable marginale.
3) La moyenne de cette distribution (sommet de la gaussienne rouge) se trouve sur une droite dite droite de régression (droite bleue). Autrement dit, la moyenne de la distribution de Y conditionnellement à X = x est une fonction linéaire de x d'équation :
|
|
L'expression "droite de régression" est justifié par la définition même de la régression qui est l'action de modélisation consistant à déterminer l'espérance d'une variable conditionnellement à la valeur d'une autre variable.
On remarquera la similitude formelle entre l'expression ci-dessus et l'équation de la Droite des Moindres Carrés en Régression Linéaire Simple.
La pente de la droite de régression est toujours inférieure (en valeur absolue) à celle de l'axe principal (ou "Première Composante Principale") de la distribution complète. Ceci implique que, lorsqu'on se déplace sur la droite verticale x = x0, le maximum de la densité conditionnelle n'est pas sur l'axe principal, un fait parfois considéré comme contraire à l'intuition.
-------
Il existe bien entendu des résultats analogues pour la distribution de X conditionnellement à Y = y0.
En toute rigueur, la distribution normale bivariée ne requiert
pas de traitement séparé, n'étant qu'un cas particulier de la distribution normale
multivariée générale. Néanmoins, il est utile de lui consacrer un chapitre séparé
pour au moins deux raisons :
* La distribution normale bivariée
est très souvent rencontrée en pratique, et les équations la décrivant sont
suffisamment simples pour être alors préférées aux équations, plus complexes,
décrivant la distribution normale multivariée générale.
* Sur le plan pédagogique, elle offre deux avantages :
- Tous les résultats s'y rapportant peuvent être aisément visualisés (voir p. ex. l'animation ci-dessus).
- Les équations décrivant ses propriétés sont certes plus complexes que celles relatives à la distribution normale univariée, mais sont encore aisément manipulables. Par la suite, lorsqu'un nombre de quelconque de variables doivent être prises en compte, ces équations deviennent très encombrantes et sont alors avantageusement remplacées par des expressions matricielles, plus compactes. La distribution binormale offre donc la possibilité d'introduire "en douceur" certains points d'Algèbre Linéaire, en établissant des résultats d'abord sous la forme habituelle d'équations "ordinaires", puis en exprimant ces résultats sous forme matricielle.
_________________________________________________________
|
Tutoriel 1 |
Ce premier Tutoriel comprend deux parties :
1) Dans la première partie,
nous définissons la distribution normale bivariée standard non pas à partir
de sa densité de probabilité, mais à partir de ses deux distributions marginales,
qui seront deux distributions normales (univariées) standard entre lesquelles
nous introduirons une corrélation ajustable. Cette corrélation apparaîtra sous
la forme d'un coefficient de corrélation
.
Nous en déduirons alors seulement la densité de probabilité de la distribution normale bivariée standard.
Nous décrirons ensuite les propriétés essentielles de la distribution normale bivariée standard :
* La densité de probabilité s'exprime simplement à partir de l'inverse de la matrice de covariance des deux variables marginales. Ce résultat est sans grand intérêt pour la distribution normale bivariée, mais se généralise à la distribution normale multivariée, où il est alors essentiel.
* Les variables marginales sont indépendantes si et seulement si elles sont décorrélées.
* Nous calculerons les distributions conditionnelles, qui sont elles-mêmes normales, et dont les propriétés sont importantes.
* Nous montrerons comment une rotation des axes permet de ramener la distribution normale bivariée standard à la distribution conjointe de deux variables normales indépendantes dont nous établirons les propriétés.
* Enfin, nous montrons que les lignes d'égale densité sont des ellipses, (appelées parfois ellipses de covariance) dont nous calculons les orientations et les longueurs des axes.
2) Dans la deuxième partie, nous définissons la distribution normale bivariée générale comme la distribution conjointe de deux variables X et Y (qu'il n'est pas nécessaire de supposer normales) dont les versions standardisées ont une distribution conjointe normale bivariée standard.
Il devient alors nécessaire de calculer les distributions marginales (c.à.d. les distributions de X et de Y ) qui seront, sans surprise, normales. Ainsi, la normalité de X et de Y apparaîtra comme une conséquence de la binormalité du couple (X, Y ). Nous nous apercevrons qu'un résultat auxiliaire de ce calcul est la détermination "involontaire" des distributions conditionnelles de la distribution binormale.
Nous confirmerons ce dernier résultat en calculant directement ces distributions conditionnelles, ce qui représentera un effort un peu plus important que dans le cas de la distribution normale bivariée standard.
DISTRIBUTION NORMALE BIVARIEE
|
Distribution normale bivariée standard Les deux distributions marginales Distribution binormale standard de coefficient de corrélation r Distribution binormale standard et matrice de covariance Décorrélation et indépendance Distributions conditionnelles Rotation des axes et distributions marginales indépendantes Ellipses isodensité Distribution normale bivariée générale Densité de probabilité Distributions marginales Distributions conditionnelles |
||
|
TUTORIEL |
||
____________________________________________________________
|
Tutoriel 2 |
Nous venons d'évoquer le fait que si les deux variables normales d'une distribution binormale standard sont décorrélées, alors ces variables sont indépendantes. L'association des termes "décorrélées" et "indépendantes" est si fréquente lorsqu'il s'agit de variables normales que l'idée selon laquelle "Si deux variables normales sont décorrélées, alors elles sont indépendantes" est largement répandue.
Sous cette forme, l'idée est incomplète, et donc fausse.
Dans ce Tutoriel, nous donnons deux contre-exemples. Pour chacun, nous exhibons une paire (X, Y) de variables normales standard dont nous montrons qu'elles sont décorrélées, et pourtant non indépendantes. Cette combinaison inhabituelle, pour des variables normales, de "décorrélation sans indépendance" a également pour conséquence les faits suivants :
* Deux variables normales peuvent avoir une somme non normalement distribuée.
* Une distribution bivariée
peut avoir des distributions marginales normales sans être pour autant binormale.
Nous
donnons ensuite la version complète (et correcte) du lien logique entre "décorrélation"
et "indépendance" pour les variables normales.
-----
Ces deux contre-exemples sont illustrés dans une même animation interactive.
VARIABLES NORMALES DECORRELEES
ET POURTANT NON
INDEPENDANTES
|
Contre-exemple n°1 Définition de Y Y est normale standard X et Y sont décorrélées X et Y ne sont pas indépendantes La somme X + Y n'est pas normalement distribuée Contre-exemple n°2 Définition de Y Y est normale standard X et Y sont décorrélées X et Y ne sont pas indépendantes La somme X + Y n'est pas normalement distribuée _________________________________________ |
||
|
TUTORIEL |
||
___________________________________________________
Voir aussi:
|