Cochran (Théorème de)
Un Théorème important de Statistique dont découlent les résultats portant sur la nature en Chi-2 de la distribution de certaines quantités :
* En Régression Linéaire,
* Et en Analyse de la Variance.
Nous avons montré que si deux variables X1
et X2 indépendantes sont distribuées respectivement comme
m
et
n ,
alors la variable X = X1 + X2 est
ditribuée comme
m
+ n . C'est ce que l'on appelle la propriété d'additivité
de la distribution du
.
Dans de nombreuses situations se pose plutôt la question inverse. On dispose de trois variables X, X1 et X2 dont on sait que :
* X = X1 + X2
* X~
r
pour un certain entier r
* X1~
q pour
un certain entier p < r
Il est alors tentant de penser que X2 est une v.a. :
* Indépendante de X1,
* et qu'elle est distribuée
comme
q,
avec r = p + q.
Cette intuition est justifiée, et se démontre simplement en ayant recours à la fonction génératrice des moments de la distribution du Chi-2.
Le Théorème de Cochran généralise le résultat précédent. Il existe sous de nombreuses formes, mais une des plus utilisée en Statistique s'énonce ainsi :
* Soit Q une forme
quadratique dans un vecteur multinormal x ayant une distribution
à r degrés de liberté.
* Soient par ailleurs k formes quadratiques Q1, Q2, ..., Qk telles que :
Q = Q1 + Q2, ...+ Qk
On suppose que les k - 1 premières formes quadratiques Qi :
* Sont indépendantes.
* Et ont des distributions du Chi-2 :
Qi ~
ri
avec :
i
ri < r i
= 1, 2, ..., (k - 1)
Alors la dernière forme quadratique, Qk :
1) Est indépendante des Qi, i = 1, 2, ..., k - 1.
2) A elle aussi une distribution du Chi-2 :
Qk ~
rk
3) Son nombre de degrés de liberté rk étant tel que :
i
ri = r i
= 1, 2, ..., k
Ce résultat est clairement une généralisation de la propriété de soustractivité évoquée plus haut.
Bien que l'énoncé ci-dessus satisfasse beaucoup des besoins de la Statistique, nous croyons utile d'en donner une version plus générale, que nous démontrons intégralement dans le Tutoriel ci-dessous :
|
* Soit x~N(0, In ) un vecteur normal multivarié standard. * Soient k matrices symétriques Ai (i = 1, 2, ..., k) de même ordre et notons : A = A1 + A2 + ... + Ak * Soit Qi = x'Ai x la forme quadratique associée à la matrice Ai. _____________________________ Alors les trois propositions suivantes sont équivalentes : (1) A²
= A et r(A) = (2) Ai²
= Ai pour tout i,
et AiAj =
0 pour i (3) Les Qi sont
indépendantes et Qi ~ |
Le lecteur peut s'inquiéter de voir apparaître des matrices et le langage de l'Algèbre Linéaire. Cependant, rappelons que :
* La distribution du Chi-2 apparaît le plus souvent comme la distribution d'une forme quadratique dans un vecteur multinormal (c'est en particulier le cas de sa définition première),
* Et que les propriétés distributionnelles et d'indépendance des formes quadratiques découlent de résultats mathématiques qui ne relèvent pas directement de la Statistique mais très directement des propriétés (symétrie, idempotence, rang) de certaines matrices, et donc de l'Algèbre Linéaire.
Par ailleurs, un survol de l'évolution historique des démonstrations du Théorème de Cochran montre que le recours systématique à l'Algèbre Linéaire conduit à des démonstrations beaucoup plus compactes et compréhensibles que celles essayant de s'en passer.
On remarquera que les propositions (1) et (2) ci-dessus ne concernent nullement la Statistique, mais forment un énoncé d'Algèbre Linéaire. La Statistique ne vient se greffer sur ces deux propositions que dans la proposition (3). Nous verrons que, grâce aux résultats déjà obtenus sur les formes quadratiques dans des vecteurs multinormaux, l'équivalence de (3) et de (2) devient alors très simple à montrer. Autrement dit, le gros du travail de la démonstration du Théorème de Cochran porte sur l'équivalence de (1) et de (2).
Nous invitons le lecteur à se rapporter dans un premier temps aux propriétés des opérateurs de projection.
-----
Il apparaît alors que le Théorème de Cochran reçoit l'interprétation géométrique suivante :
* Soit E un espace vectoriel de dimension r.
* Soient E1, E2, ..., Ek des sous-espaces deux à deux orthogonaux et dont la somme des dimensions soit égale à r.
* Par ailleurs, soit x~N(0, Ir) un vecteur normal multivarié standard.
Alors :
* Pour tout i, le
carré de la longueur de la
projection orthogonale de x sur Ei est
une variables aléatoire
distribuée comme
[dim(Ei)].
* Ces variables aléatoires sont indépendantes.
Réciproquement :
* Si les carrés des longueurs
des projections orthogonales d'un vecteur x~N(0, Ir) sur
k sous-espaces Ei sont indépendantes et
ont des distributions du
,
* Et si la somme des degrés de liberté de ces distributions est égale à r, la dimension de l'espace,
Alors :
* Ces sous-espaces sont orthogonaux et supplémentaires (tout vecteur se décompose de façon unique comme somme d'un vecteur dans chacun des sous-espaces).
-----
On remarquera la similarité formelle entre l'interprétation géométrique du Théorème de Cochran et la généralisation du Théorème de Pythagore à un espace de dimension quelconque. Ce dernier s'énonce :
* Soit E un espace vectoriel de dimension r.
* Soient E1, E2, ..., Ek des sous-espaces deux à deux orthogonaux et dont la somme des dimensions soit égale à r.
* Par ailleurs, soit x un vecteur.
Alors :
* La somme des carrés des longueurs des projections orthogonales de x sur les Ei est égale au carré de la longueur de x.
Réciproquement :
* Si la somme des carrés des longueurs des projections orthogonales de x sur k espaces Ei est égale au carré de la longueur de x,
* Alors ces sous-espaces sont orthogonaux et supplémentaires (leur somme directe est égale à E).
Autrement dit, dans cette analogie formelle :
* "Vecteurs orthogonaux"
est remplacé par "variables
indépendantes".
* "Somme des carrés des
longueurs" est remplacé par "somme des degrés de liberté des distributions
".
_______________________________________________________
|
Tutoriel |
Dans ce Tutoriel, nous démontrons le Théorème de Cochran.
* Nous commençons par démontrer un certain nombre de résultats élémentaires d'Algèbre Linéaire dont nous aurons besoin dans la suite du Tutoriel. Cette section représente la plus grosse partie du Tutoriel.
* La démonstration de la partie "algébrique" du Théorème de Cochran est alors une simple mise en œuvre de ces résultats sur les hypothèses de départ.
* La partie "statistique" du Tutoriel est très courte. Il faut cependant remarquer que cette brièveté n'est rendue possible que par l'établissement préalable des propriétés distributionnelles et d'indépendance des formes quadratiques dans des vecteurs normaux multivariés, un sujet assez volumineux abordé ici.
-----
Nous concluons ce Tutoriel par un exemple simple d'utilisation du Théorème de Cochran en démontrant une propriété importante de la distribution normale :
* La moyenne empirique,
* Et la variance empirique
sont des variables aléatoires indépendantes.
De plus, nous retrouverons que (n - 1)S²/
²
(où S² est la variance empirique) est distribuée comme
n
- 1.
THEOREME DE COCHRAN
|
Résultats préliminaires Rang du produit de deux matrices Décomposition d'une matrice en un produit de deux matrices de rang plein Inverse à gauche d'une matrice de rang plein Décomposition d'une matrice idempotente Trace d'un produit de matrices Rang et trace d'une matrice idempotente Le Théorème de Cochran en Algèbre Linéaire Décomposition des matrices et concaténation des composantes (1) implique (2) (2) implique (1) Le Théorème de Cochran en Statistique (3) implique (2) (2) implique (3) Exemple : moyenne et variance empiriques de la distribution normale |
||
|
TUTORIEL |
||
_____________________________________________________
Voir aussi :