Espérance
La plus utilisée des mesures de tendance centrale d'une variable aléatoire.
Soit X une variable aléatoire discrète. L'espérance de X, notée E[X], est la somme pondérée des valeurs du domaine de X, les "poids" étant égaux, par définition, aux probabilités des valeurs correspondantes.
Ainsi, si on note {xi} cet ensemble de valeurs (qui peut être infini, comme par exemple pour une variable de Poisson), on a, par définition :
|
E[X] = Si xi P{X = xi} |
où P{X = xi} est la probabilité pour que X prenne la valeur xi.
Ainsi, la valeur de l'espérance est plus influencée par les valeurs fortement probables de X que par les valeur faiblement probables.
Si toutes les probabilités P{X = xi} sont égales, alors l'espérance de X est simplement la moyenne des valeurs {xi}, qui sont alors obligatoirement en nombre fini.
Si la variable X est continue et si elle admet une densité de probabilité p(x), alors la définition de son espérance est la généralisation au cas continu de l'expression ci-dessus :
|
|
Les expressions ci-dessus montrent que la définition de l'espérance d'une variable aléatoire est identique à la définition de la moyenne µ de la distribution dont elle est issue. Dans ce Glossaire, nous utiliserons les termes :
* "Espérance" quand nous considérons une v.a., et
* "Moyenne" quand nous considérons une distribution de probabilité.
Aussi bien dans le cas discret que dans le cas continu, l'expression définissant l'espérance peut ne pas être définie.
Ainsi, les distributions Fm, n de Fisher pour m = 1 ou m = 2 n'ont pas de moyenne. La raison en est que, bien que la fonction Fm, n décroisse alors assez rapidement pour que son intégrale de 0 à l'infini soit égale à 1, il n'en est plus de même pour l'intégrand définissant la moyenne : il tend bien vers 0 quand x tend vers l'infini, mais pas suffisamment rapidement pour que son intégrale soit finie.
Ainsi, une v.a. suivant la distribution Fm ,n pour m = 1 ou 2 n'a pas d'espérance.
-----
Un autre cas classique de v.a. n'ayant pas d'espérance est celui d'une v.a. suivant une distribution de Cauchy. La distribution de Cauchy est symétrique par rapport à l'origine, et il semblerait donc que sa moyenne soit nulle. La difficulté réside dans le fait que la quantité :

tend vers l'infini quand a tend vers l'infini. Devant ce genre de situation, on est alors amené à imposer comme condition de définition de l'espérance que chacune des quantités :

et

soit finie, ce qui permet alors de définir l'espérance comme la somme des deux intégrales.
Dans le cas de la distribution de Cauchy, les deux intégrales sont infinies. L'expression de l'espérance est alors de la forme
-4 + (+4)
qui n'est pas définie, et une variable de Cauchy n'a donc pas d'espérance, comme nous le montrerons.
L'espérance représente intuitivement la tendance centrale de la variable aléatoire considérée, de même, bien sûr, que la moyenne de sa distribution. Les inégalités de Markov et de Bienaymé-Tchebichev montrent en effet qu'il devient de plus en plus difficile à une v.a. d'atteindre une valeur qui s'éloigne de plus en plus de son espérance.
Cependant, il faut garder présent à l'esprit que la valeur de l'espérance d'une v.a. n'est pas nécessairement la valeur la plus fréquemment observée des réalisations de cette variable. En particulier :
* Dans le cas d'une variable discrète, la valeur de l'espérance peut être une valeur que la v.a. ne peut pas prendre. Ainsi, l'espérance de la v.a. représentant un dé est égale à :
(1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5
une valeur non entière, et donc qu'aucun lancer ne peut produire.
* Dans le cas d'une variable continue, la valeur de l'espérance peut être une valeur pour laquelle la densité de probabilité est nulle, et la v.a. ne prendra alors jamais une valeur égale à son espérance.

La justification de la popularité de la notion d'espérance vient de la Loi des Grande Nombres qui dit en substance que, sauf terrible malchance, la moyenne des réalisations successives d'une v.a. tend vers l'espérance de cette v.a. quand le nombre de réalisations tend vers l'infini. Ce résultat confère un statut quasiment expérimental à la notion mathématique d'espérance.
La notion d'espérance joue une rôle central dans la définition des moments d'ordre supérieur.
* Les moments sont eux-mêmes, par définition, des espérances. Ainsi, le moment d'ordre n d'une v.a. X est-il défini comme étant égal à E[X n].
* Il est courant de considérer les moments centrés, où la v.a. est dans un premier temps rapportée à son espérance. Par définition, le moment centré d'ordre n est donc :
E[(X - E[X])n]
C'est en particulier le cas de la variance Var(X), qui est le moment centré d'ordre 2 de X. Notons que l'expression ci-dessus se transforme alors dans l'expression très utile :
Espérance d'une fonction d'une variable aléatoire
Soit X une v.a., et f(.) une fonction quelconque. Quelle est l'espérance de la variable aléatoire Y = f(X ) ?
Prenons par exemple le cas où X a une densité de probabilité p(x) et où f(.) est une fonction suffisamment régulière pour que Y ait également une densité de probabilité g(y). Alors, par définition, l'espérance de Y est :

Malheureusement, même s'il existe des situations particulières dans lesquelles on peut calculer explicitement g(y) à partir de f(x), le calcul est en général impossible. Mais heureusement, ce calcul n'est en fait pas nécessaire pour ce que nous voulons faire. On montre en effet que l'espérance de Y est donnée par
|
|
Un résultat similaire existe quand X est discrète. Notons p(.) la fonction :
p(xi) = P{X = xi}
Alors on montre que :
|
E[Y] = Si f(xi)p(xi) |
-----
Ces résultats semblent tellement naturels que nombre de statisticiens débutants les utilisent spontanément sans se rendre compte qu'il ne s'agit pas de définitions, mais de théorèmes. C'est la raison pour laquelle ils sont souvent connus dans la littérature anglo-saxone sous le sobriquet de "Laws of the Unconscious Statistician" (ou "LOTUS").
Ces deux résultats sont démontrés dans le Tutoriel ci-dessous.
Nous obtiendrons un résultat similaire, mais plus complexe, pour des fonctions de deux variables aléatoires. Nous aurons besoin de ce résultat :
* Pour calculer l'espérance d'une combinaison linéaire de variables aléatoires (voir ci-dessous).
* Pour calculer l'espérance du produit de deux variables aléatoires (voir ci-dessous).
Propriétés élémentaires de l'espérance
L'espérance a de nombreuses propriétés dont les plus importantes sont les suivantes.
Soit X une v.a., et a et b deux nombres réel. Alors :
|
E[aX + b] = aE[X] + b |
Soient {X1, ..., Xn } n v.a., et {a1, ..., an } n nombres réels. Alors :
|
E[Si ai Xi] = Si ai E[Xi] |
-----
Les deux résultats précédents sont démontrés dans le Tutoriel ci-dessous.
Soient X et Y deux variables aléatoires. Quelle est l'espérance de leur produit XY ? Le résultat fait appel à la notion d'espérance conditionnelle. On a :
|
E[XY] = E[X.E[Y | X]] |
Il existe une borne supérieure à la valeur absolue de l'espérance du produit de deux v.a., qui est donnée par l'inégalité de Cauchy-Schwarz (voir ici) :
|
| E[XY] | |
où | ... | désigne la valeur absolue.
C'est en particulier de ce résultat que l'on déduit que le coefficient de corrélation de deux v.a. est compris entre -1 et +1.
Du résultat ci-dessus, on déduit que deux variables X et Y sont décorrélées si et seulement si :
E[XY] = E[X].E[Y]
Le passage de la simple décorrélation à l'indépendance impose le recours à une condition plus forte. On montre que X et Y sont indépendantes si et seulement si, pour toute paire de fonctions f et g, on a :
E[ f(X)g(Y)] = E[ f(X)].E[ f(Y)]
sous réserve que les espérances existent.
Nous démontrons ici ce résultat.
Soit X et Y deux v.a. L'espérance (inconditionnelle) de X est reliée à l'espérance de X conditionnellement à Y par le Théorème dit de "l'Espérance Itérée" :
|
E[X] = E[E[X | Y]] |
Nous donnons ici deux démonstrations de cet important résultat, ainsi que des exemples de son utilité pour calculer non seulement des espérances mais également des probabilités ou des fonctions génératrices des moments.
___________________________________________________
|
Tutoriel |
Dans un premier temps, nous évacuons la question de l'existence de l'espérance en montrant que, effectivement, une variable de Cauchy n'a pas d'espérance, et qu'il est donc possible qu'une v.a. n'ait pas d'espérance.
Dans la suite de ce Tutoriel, les v.a. sont toujours considérées comme ayant une espérance.
-----
Nous calculons ensuite l'espérance d'une fonction d'une variable aléatoire. La démonstration dans le cas discret ne s'étend pas au cas continu, et les deux situations exigent donc des traitements séparés.
Afin de commencer en douceur, nous supposerons la fonction bijective, ce qui simplifie notablement la démonstration. Nous lèverons cette restriction dans la seconde partie du Tutoriel.
Nous utiliserons le résultat obtenu pour calculer l'espérance de la transformée linéaire d'une variable aléatoire.
-----
Nous calculons ensuite l'espérance d'une fonction de deux variables aléatoires. A nouveau, les cas discret et continu doivent être traités séparément. Maintenant que nous sommes familiarisés avec le mode de raisonnement relatif à ce genre de problème, nous n'exigeons plus que la fonction soit bijective. Ceci rend la démonstration plus difficile, mais également plus générale.
Nous utiliserons le résultat obtenu pour calculer l'espérance d'une combinaison linéaire de variables aléatoires.
ESPERANCE D'UNE FONCTION D'UNE
OU DE DEUX VARIABLES ALEATOIRES
|
Une variable de Cauchy n'a pas d'espérance Espérance d'une fonction d'une variable aléatoire Cas discret Cas continu Espérance d'une transformation linéaire Espérance d'une fonction de deux variables aléatoires Cas discret Cas continu Espérance d'une combinaison linéaire de variables aléatoires Combinaison linéaire de deux variables Combinaison linéaire d'un nombre quelconque de variables |
||
|
TUTORIEL |
||
____________________________________________
Voir aussi: