Animation interactive

t  (Distribution)

Rappel

Soit X ~ N(µ, ²) une variable aléatoire de distribution normale. La distribution de la moyenne empirique  des échantillons de n observations est également normale:

    * de moyenne µ,

    * et de variance ²/n.

~ N(µ, ²/n)

La variable standardisée

 

est l'écart de la moyenne empirique à la moyenne vraie, rapporté à l'écart-type de sa propre distribution utilisé comme "unité de longueur".

z est normale de moyenne nulle et de variance unité.

z ~ N(0, 1)

 

Donc, lorsque la variance ² d'une distribution normale est connue, la distribution de la moyenne empirique est très simplement ramenée à une distribution normale standard.

La statistique T

Que se passe-t-il si la moyenne µ est connue, mais pas la variance ² ? On est conduit à remplacer la variance vraie ² par son estimation sans biais:

 

dans l'expression de z, pour obtenir la variable T. En posant

on a

 

T peut être calculée à partir des observations uniquement, car ne figure pas dans son expression.

Malheureusement, S est une variable aléatoire, ce qui écarte la distribution de T d'une simple distribution normale standard. Quelle est la distribution de T ?

Distribution t de Student

Cette distribution est connue sous le nom de "Distribution t de Student", ou simplement "Distribution t". Sa forme dépend de n, qui intervient donc comme un paramètre. La distribution de T relative à des échantillons de n observations sera appelée "Distribution t à n-1 degrés de liberté", et est notée tn-1:

T ~ tn-1

(La raison pour laquelle le nombre de degrés de liberté est n - 1 et non pas n est donnée ici).

Animation

L'animation ci-dessous illustre la distribution t.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

1) Cadre supérieur

    Il montre une distribution normale et un échantillon issu de cette distribution.

 

2) Affichage intermédiaire

    Sont affichés sous le cadre supérieur:

        * A gauche, la différence entre le moyenne de l'échantillon et la moyenne de la distribution (ici, 0). C'est le numérateur de T.

        * A droite, le dénominateur de T, soit

avec

 

3) Cadre inférieur

    Le cadre inférieur montre trois courbes:

        * La courbe la plus haute (bleue) est la gaussienne standard. C'est la distribution de z (c.à.d. quand la variance ² est connue).

        * La courbe de hauteur intermédiaire (rouge) est la distribution t correspondant au nombre courant d'observations de l'échantillon. Cette courbe est symétrique par rapport à l'axe vertical T = 0.

Notez que le nombre de degrés de liberté (df) est égal à n - 1.

        * La courbe la plus basse (noire) est la distribution t pour n = 2 (df = 1). C'est une distribution de Cauchy.

 

Sous le cadre est affichée la valeur de T pour l'échantillon courant.

_______________________________

 

    * Faites varier la taille de l'échantillon, et observez les changements dans la forme de la distribution t.


Pour ne pas être gêné par l'échantillon, vous pouvez cliquer sur le bouton "Mask sample".

Bien qu'elle ressemble toujours à la gaussienne standard, elle est toujours moins haute que cette dernière. L'aire sous la courbe étant toujours égale à 1, l'aire manquante dans la partie centrale se retrouve dans les ailes: les courbes t ont toujours des ailes plus hautes que la gaussienne standard.

Ceci est une conséquence du fait que la somme des carrés des distances des observations à la moyenne empirique est toujours plus petite que la somme des carrés des distances des observations à la moyenne vraie. L'obligation dans laquelle nous sommes d'avoir à estimer la variance de la distribution introduit une incertitude sur la valeur du rapport:

  • de l'écart entre la moyenne empirique et la moyenne vraie,
  • et de l'écart-type de la distribution mère.

 

Les grandes valeurs (absolues) de T sont plus probables que les mêmes valeurs de z (c.à.d. quand la variance ² est connue).

C'est cette remarque qui justifie l'existence même des tests t.

        

    * Observez que pour les grandes valeurs de n, la distribution t converge vers la distribution normale standard. Ceci traduit le fait que la variance estimée converge en probabilité vers la variance vraie quand n tend vers l'infini.

 

    * Observez que les ailes de la distribution t deviennent de plus en plus importantes lorsque n diminue.

 

    * La grandeur T n'a de sens que pour un échantillon d'au moins deux observations. Pour n = 2 (df = 1), la distribution t est identique à la distribution de Cauchy. Ses ailes sont tellement importantes qu'elles empêchent la distribution d'avoir une moyenne (de même que tout moment d'ordre supérieur).

 

     * Choisissez une valeur de n. Cliquez sur "Go" et observez la construction progressive de la distribution t correspondante.

 

 

Propriétés de la distribution t de Student

Densité de probabilité

Nous montrerons que la densité de probabilité de la distribution t à n degrés de liberté est :

 

 

 

Cas extrêmes

    * Pour n = 1, nous montrerons que la distribution t devient la distribution de Cauchy, comme illustré dans l'animation ci-dessus.

    * Quand n tend vers l'infini, nous montrerons que fn(x) converge vers la fdp de la distribution normale standard (voir animation).


Ce dernier résultat est également établi ici par une méthode complètement différente (application du théorème de Slutsky).

Moyenne

La distribution de Cauchy n'ayant pas de moyenne, la distribution t à 1 degré de liberté n'a pas non plus de moyenne.

La fdp de la distribution t est paire. La moyenne de la distribution t pour n ≤ 2 est donc égale à 0.

Variance

Nous montrerons que lorsqu'elle existe, la variance de la distribution t est :

 

 

Remarquez que :

    1) La variance n'existe pas pour n = 1, 2.

    2) La variance tend vers 1 par valeurs supérieures quand n tend vers l'infini.

Distribution t de Student et distribution F de Fisher

Nous montrons ici que si la v.a. T suit la distribution tm , alors T ² suit la distribution F1, m .

Application de la distribution t

Général

Le point clé de la distribution t est qu'elle ne dépend pas de la variance σ² de la distribution normale originale. Ce point est éclairci ci-dessous.

La statistique T est donc un pivot, dont on peut tirer :

Régression Linéaire

Nous montrons ici que, sous les hypothèses standard, les coefficients d'une Régression Linéaire Simple ont des distributions normales. Non seulement les variances de ces distributions sont inconnues, mais, contrairement à ce que nous avons supposé en définissant la statistique T, leurs moyennes le sont également, et doivent donc être estimées. Donc, que ce soit pour la pente ou pour l'ordonnée à l'origine, la distribution de la version standardisée du coefficient implique l'estimation de deux paramètres, et non plus d'un seul.

On montre que, en conséquence, ces coefficients standardisés ont des distributions en tn - 2, et ce sont donc ces distributions qui doivent être prises en compte pour l'élaboration des intervalles de confiance et des tests sur les coefficients de la régression.

Ce résultat est difficile, et n'est pas démontré. Mais il ne devrait pas être considéré comme surprenant que l'estimation de deux paramètres au lieu d'un seul conduise à la perte de deux degrés de liberté au lieu d'un seul.

Définition générale de la distribution t

Nous pouvons maintenant donner une définition formelle plus générale de la distribution t. Ecrivons l'expression de T en divisant numérateur et dénominateur par , l'écart-type vrai:

 

    1) Le nouveau numérateur de T est

qui a une distribution normale standard N(0, 1).
 

    2) Le nouveau dénominateur de T peut s'écrire:

Mais la variable

 

 

est distribuée comme n-1 (voir ici).

 

Le terme n - 1 (dénominateur sous le radical) est donc justement le nombre de degrés de liberté de X.

 3) Le numérateur et le dénominateur de T sont des variables indépendantes. En effet, en écrivant T sous sa forme initiale

 

    * Le numérateur a une distribution normale,

    * d'écart-type estimé S.

 

et ces deux v.a. sont indépendantes (voir ici).

 

4) On peut remarquer que T est maintenant identifiée comme étant le rapport de deux v.a. indépendantes dont les distributions ne dépendent pas de la variance de la distribution normale originale. On peut donc affirmer, sans même avoir à la calculer, que la distribution t de dépend pas de cette variance.

-----

 

La définition formelle de la distribution t est donc la suivante:
 

Une variable T est distribuée, par définition, comme tn à n degrés de liberté si:

où:

    * U est une variable normale standard N(0, 1),

    * X est une variable distribuée comme n,

    * U et X sont indépendantes.

 

 

Cette définition ne fait plus référence au problème original qui nous a conduits à identifier la distribution t, et est donc utilisable dans des contextes plus généraux. Par exemple, c'est à cette définition que nous aurons recours pour établir les distributions des paramètres estimés et des prédictions en Régression Linéaire Multiple.

______________________________________________________________________

 

 

Tutoriel 1

 

Dans ce Tutoriel, nous établissons la fonction de densité de probabilité de la distribution t.


Nous retrouvons également ce résultat ici en utilisant le résultat général relatif à la distribution du rapport de deux v.a. indépendantes.

Nous étudions ensuite les deux situations limites :

    * Pour n = 1, la distribution t est identique à la distribution de Cauchy.
   * Quand n tend vers l'infini, la fdp de la distribution t converge vers la fdp de la distribution normale standard.


Ce dernier résultat est également établi ici par une méthode complètement différente (application du théorème de Slutsky).

 Nous concluons en remarquant que bien que le nombre de degrés de liberté d'une distribution t soit nativement un nombre entier, rien n'empêche de considérer des "nombres de degrés de liberté" non entiers. Cette remarque sera utile pour calculer des intervalles de confiance approximatifs pour la différence entre deux moyennes empiriques quand les variances des distributions normales ne sont pas supposées égales (approximation de Welch).

 

 

 

DENSITE DE LA DISTRIBUTION t DE STUDENT

Densité de probabilité

Plan général de la démonstration

Définition de la distribution t

Densité de probabilité conjointe de U et de X

Fonction de répartition de la distribution t

La densité de probabilité de T

Structure de F(t )

Dérivée de F(t )

Résultat final

Cas particuliers

n = 1 : distribution de Cauchy

n  infini : distribution normale standard

Limite de la partie fonctionnelle

Limite du coefficient de normalisation

La distribution normale standard

Nombre non-entier de degrés de liberté : approximation de Welch

TUTORIEL

_____________________________________________________________

 

 

Tutoriel 2

 

L'expression de la variance d'une variable Tn suivant la distribution t à n degrés de liberté, soit :

Var(Tn ) = n / (n - 2)

est remarquablement simple. Malheureusement, on ne peut pas en dire autant des démonstrations permettant d'arriver à ce résultat.

 

Nous donnerons deux démonstrations :

    1) La première utilise l'approche directe

fn(x) est la fdp de la distribution t (rappelons que l'espérance de Tn est nulle et que sa variance est donc identique à son moment d'ordre 2).

Cette approche nous conduira à explorer les intéressantes propriétés d'une famille d'intégrales connues sous le nom d'intégrales de Wallis.


L'étude des intégrales de Wallis est poursuivie ici, et aboutit à la formule de Wallis, un ingrédient essentiel de la démonstration de la formule de Stirling.

 

    2) La deuxième approche, bien que moins directe, est plus simple. Elle considère Tn comme une variable aléatoire fonction de deux v.a. (celles de la définition formelle de la distribution t), et fait ensuite appel au théorème portant sur l'espérance d'une fonction de deux variables aléatoires (LOTUS) pour calculer l'espérance de Tn².

 

 

 

VARIANCE DE LA DISTRIBUTION t

Première méthode : calcul direct

Séparation de l'intégrale

Changement de variable et intégrales de Wallis

Relation de récurrence des intégrales de Wallis

Valeur de l'intégrale de Wallis

n pair

n impair

Coefficient de normalisation

La variance

Deuxième méthode : espérance d'une fonction de deux v.a.

TUTORIEL

 

__________________________________________________________

 

Voir aussi :

Distribution normale

Intervalle de confiance

Test t

T comme rapport de deux variables aléatoires

Le carré d'une Tn de Student est une F1, n de Fisher

Distribution de Cauchy

Formule de Wallis

Téléchargez ce Glossaire