Jensen (Inégalité de)
L'inégalité de Jensen est un résultat mathématique qui trouve de nombreuses applications en Probabilité et en Statistique. Elle porte sur une propriété des fonctions convexes (resp. concaves), et, en ce qui nous concerne, plus particulièrement sur une propriété des transformations de variables aléatoires par une fonction convexe (resp. concave).
Rappelons qu'une fonction f(x) est dite convexe si son graphe est "tourné vers le haut", comme dans la figure ci-dessous.
Une fonction f est dite "concave"
si -f est convexe.
La notion de fonction convexe se formalise de la façon suivante (image inférieure de l'illustration ci-dessous) :
* Soient A et B deux points du graphe de f(x).
* Soit S le segment de droite joignant A à B.
* Alors, tout point de S est situé au-dessus du point correspondant du graphe de f(x).
et s'exprime mathématiquement par :
* Pour tout a et b, a < b
* Pour tout nombre λ, 0 < λ < 1 (pour tout point du segment S)
f(λa + (1 - λ)b)
λ. f(a) + (1 - λ).f(b)
Une fonction convexe peut ne pas avoir de minimum : par
exemple, y = exp(x) est convexe, mais n'a pas de minimum.
Imaginons maintenant un ensemble fini {x1,
x2 , ..., xn}de points régulièrement
espacés sur l'axe des x. La figure ci-dessous suggère que la convexité
de f a pour effet d'étirer l'image des {x1, x2 ,
..., xn} vers les grandes valeurs de y, et ce
d'autant plus que l'on considère des grandes valeurs de x (ou
de y). On peut donc raisonnablement s'attendre à ce que la moyenne
des f(xi) soit plus grande que la transformée f(
) de
la moyenne des xi.

Cette intuition est justifiée, et l'inégalité de Jensen en est la formalisation mathématique. Nous allons voir qu'elle est en fait un peu plus générale que ce que nous venons de décrire, et s'applique :
* A une répartition quelconque des points (et pas seulement à des points régulièrement espacés).
* Non seulement à la moyenne, mais en fait au barycentre des points munis d'une pondération quelconque.
L'inégalité de Jensen existe sous deux formes : finie et continue.
Nous considérons donc un ensemble fini quelconque de points {x1, x2 , ..., xn}.
* Ces points reçoivent des poids positifs quelconques λi tels que Σiλi = 1.
* Soit par ailleurs f(x) une fonction convexe.
Alors :
|
Σiλi f(xi)
|
Autrement dit, la coordonnée du barycentre des transformés des points (pondérés par les λi) a une valeur plus grande que celle du transformé du barycentre de ces points.
Si tous les λi sont pris égaux à 1/n, on a le résultat suivant :
La moyenne des transformés par une fonction convexe est supérieure à la transformée de la moyenne.
Si, au lieu d'un ensemble fini de points, nous considérons une densité de probabilité p(x), le résultat ci-dessus reste valable sous la forme suivante :

où le rôle des poids λi est maintenant tenu par les valeurs de la densité p(x).
Si E[X] désigne l'espérance d'une variable aléatoire X, nous avons donc :
|
E[ f(X)] |
qui se lit :
L'espérance de la transformée d'une v.a. X par une fonction convexe est supérieure à la transformée de l'espérance de X.
Utilisation de l'inégalité de Jensen
Nous nous servons de l'inégalité de Jensen dans l'étude de la distance de Kullbak-Leibler.
_________________________________________________________
|
Tutoriel |
Nous démontrons ici l'inégalité de Jensen dans le cas fini et dans le cas continu.
Dans ce dernier cas, nous n'envisageons que la situation la plus courante, où la fonction convexe est partout dérivable.
DEMONSTRATION DE L'INEGALITE DE JENSEN
|
Cas fini Cas continu |
||
|
TUTORIEL |
||
________________________________________________________
Voir aussi: