Cochran  (Théorème de)

Un Théorème important de Statistique dont découlent les résultats portant sur la nature en Chi-2 de la distribution de certaines quantités :

    * En Régression Linéaire,

    * Et en Analyse de la Variance.

Soustractivité de la distribution du Chi-2

Additivité

Nous avons montré que si deux variables X1 et X2 indépendantes sont distribuées respectivement comme m et n , alors la variable X = X1X2  est ditribuée comme m + n . C'est ce que l'on appelle la propriété d'additivité de la distribution du .

Soustractivité

Dans de nombreuses situations se pose plutôt la question inverse. On dispose de trois variables X, X1 et X2 dont on sait que :

    * X = X1X2

    * X~r   pour un certain entier r

    * X1~q   pour un certain entier p < r

 

Il est alors tentant de penser que X2  est une v.a. :

    * Indépendante de X1,

    * et qu'elle est distribuée comme q, avec r = p + q.

 

Cette intuition est justifiée, et se démontre simplement en ayant recours à la fonction génératrice des moments de la distribution du Chi-2.

Généralisation de la soustractivité

Le Théorème de Cochran généralise le résultat précédent. Il existe sous de nombreuses formes, mais une des plus utilisée en Statistique s'énonce ainsi :

    * Soit Q une forme quadratique dans un vecteur multinormal x ayant une distribution à r degrés de liberté.

    * Soient par ailleurs k formes quadratiques Q1, Q2, ..., Qk telles que :

Q = Q1Q2, ...+ Qk

On suppose que les k - 1 premières formes quadratiques Qi :

    * Sont indépendantes.

    * Et ont des distributions du Chi-2 :

Qi ~ ri 

avec :

i ri < r               i = 1, 2, ..., (k - 1)

Alors la dernière forme quadratique, Qk :

    1) Est indépendante des Qi, i = 1, 2, ..., k - 1.

    2) A elle aussi une distribution du Chi-2 :

Qk ~ rk 

    3) Son nombre de degrés de liberté rk étant tel que :

i ri = r        i = 1, 2, ..., k

 

Ce résultat est clairement une généralisation de la propriété de soustractivité évoquée plus haut.

Le Théorème de Cochran

Bien que l'énoncé ci-dessus satisfasse beaucoup des besoins de la Statistique, nous croyons utile d'en donner une version plus générale, que nous démontrons intégralement dans le Tutoriel ci-dessous :

 

 

* Soit x~N(0, In ) un vecteur normal multivarié standard.

* Soient k matrices symétriques Ai (i = 1, 2, ..., k) de même ordre et notons :

A = A1 + A2 + ... + Ak 

* Soit Qi = x'Ai x la forme quadratique associée à la matrice Ai.

_____________________________

Alors les trois propositions suivantes sont équivalentes :

     (1)  A² = A  et  r(A) = i r(Ai)

     (2)  Ai² = Ai  pour tout i, et AiAj  = 0  pour i  j

     (3) Les Qi sont indépendantes et Qi ~ ri où ri est le rang de Ai.

 

 

Le lecteur peut s'inquiéter de voir apparaître des matrices et le langage de l'Algèbre Linéaire. Cependant, rappelons que :

    * La distribution du Chi-2 apparaît le plus souvent comme la distribution d'une forme quadratique dans un vecteur multinormal (c'est en particulier le cas de sa définition première),

    * Et que les propriétés distributionnelles et d'indépendance des formes quadratiques découlent de résultats mathématiques qui ne relèvent pas directement de la Statistique mais très directement des propriétés (symétrie, idempotence, rang) de certaines matrices, et donc de l'Algèbre Linéaire.

 

Par ailleurs, un survol de l'évolution historique des démonstrations du Théorème de Cochran montre que le recours systématique à l'Algèbre Linéaire conduit à des démonstrations beaucoup plus compactes et compréhensibles que celles essayant de s'en passer.

Théorème de Cochran, Algèbre Linéaire et Statistique

On remarquera que les propositions (1) et (2) ci-dessus ne concernent nullement la Statistique, mais forment un énoncé d'Algèbre Linéaire. La Statistique ne vient se greffer sur ces deux propositions que dans la proposition (3). Nous verrons que, grâce aux résultats déjà obtenus sur les formes quadratiques dans des vecteurs multinormaux, l'équivalence de (3) et de (2) devient alors très simple à montrer. Autrement dit, le gros du travail de la démonstration du Théorème de Cochran porte sur l'équivalence de (1) et de (2).

Interprétation géométrique du Théorème de Cochran

Nous invitons le lecteur à se rapporter dans un premier temps aux propriétés des opérateurs de projection.

-----

Il apparaît alors que le Théorème de Cochran reçoit l'interprétation géométrique suivante :

    * Soit E un espace vectoriel de dimension r.

    * Soient E1, E2, ..., Ek des sous-espaces deux à deux orthogonaux et dont la somme des dimensions soit égale à r.

    * Par ailleurs, soit x~N(0, Ir) un vecteur normal multivarié standard.

Alors :

    * Pour tout i, le carré de la longueur de la projection orthogonale de x sur Ei est une variables aléatoire distribuée comme [dim(Ei)].

    * Ces variables aléatoires sont indépendantes.

 

Réciproquement :

    * Si les carrés des longueurs des projections orthogonales d'un vecteur x~N(0, Ir) sur k sous-espaces Ei sont indépendantes et ont des distributions du ,

    * Et si la somme des degrés de liberté de ces distributions est égale à r, la dimension de l'espace,

Alors :

    * Ces sous-espaces sont orthogonaux et supplémentaires (tout vecteur se décompose de façon unique comme somme d'un vecteur dans chacun des sous-espaces).

-----

On remarquera la similarité formelle entre l'interprétation géométrique du Théorème de Cochran et la généralisation du Théorème de Pythagore à un espace de dimension quelconque. Ce dernier s'énonce :

    * Soit E un espace vectoriel de dimension r.

    * Soient E1, E2, ..., Ek des sous-espaces deux à deux orthogonaux et dont la somme des dimensions soit égale à r.

    * Par ailleurs, soit x un vecteur.

Alors :

    * La somme des carrés des longueurs des projections orthogonales de x sur les Ei est égale au carré de la longueur de x.

 

Réciproquement :

    * Si la somme des carrés des longueurs des projections orthogonales de x sur k espaces Ei est égale au carré de la longueur de x,

    * Alors ces sous-espaces sont orthogonaux et supplémentaires (leur somme directe est égale à E).

 

Autrement dit, dans cette analogie formelle :

    * "Vecteurs orthogonaux" est remplacé par "variables  indépendantes".

    * "Somme des carrés des longueurs" est remplacé par "somme des degrés de liberté des distributions ".

 _______________________________________________________

 

 

 

Tutoriel

 

Dans ce Tutoriel, nous démontrons le Théorème de Cochran.

    * Nous commençons par démontrer un certain nombre de résultats élémentaires d'Algèbre Linéaire dont nous aurons besoin dans la suite du Tutoriel. Cette section représente la plus grosse partie du Tutoriel.

    * La démonstration de la partie "algébrique" du Théorème de Cochran est alors une simple mise en œuvre de ces résultats sur les hypothèses de départ.

    * La partie "statistique" du Tutoriel est très courte. Il faut cependant remarquer que cette brièveté n'est rendue possible que par l'établissement préalable des propriétés distributionnelles et d'indépendance des formes quadratiques dans des vecteurs normaux multivariés, un sujet assez volumineux abordé ici.

-----

Nous concluons ce Tutoriel par un exemple simple d'utilisation du Théorème de Cochran en démontrant une propriété importante de la distribution normale :

    * La moyenne empirique,

    * Et la variance empirique

sont des variables aléatoires indépendantes.

De plus, nous retrouverons que (n - 1)S²/² (où S² est la variance empirique) est distribuée comme n - 1.

 

 

 

 

THEOREME DE COCHRAN

Résultats préliminaires

Rang du produit de deux matrices

Décomposition d'une matrice en un produit de deux matrices de rang plein

Inverse à gauche d'une matrice de rang plein

Décomposition d'une matrice idempotente

Trace d'un produit de matrices

Rang et trace d'une matrice idempotente

Le Théorème de Cochran en Algèbre Linéaire

Décomposition des matrices et concaténation des composantes

(1) implique (2)

(2) implique (1)

Le Théorème de Cochran en Statistique

(3) implique (2)

(2) implique (3) 

Exemple : moyenne et variance empiriques de la distribution normale

TUTORIEL

 

_____________________________________________________

 

Voir aussi :

Distribution normale multivariée

Formes quadratiques

Matrices de projection

Téléchargez ce Glossaire