Quantiles
Aussi appelé "fractiles".
Soit p(x) une distribution continue. L'aire sous la courbe représentant p(x) est égale à 1.
Soit maintenant a un nombre compris entre 0 et 1 :
0 < a < 1
Il existe un point unique xa
tel que l'aire sous p(x) entre -
et
a soit égal à a. Ce point est appelé le quantile d'ordre a de la
distribution.
Les quantiles sont souvent exprimés en pourcents (%), et donc on dira que xa est le 100.a% quantile de la distribution. Ainsi, par exemple :
Si F(x) désigne la fonction de répartition de p(x), on a a = F(xa), et donc (image inférieure de l'illustration ci-dessus) :
xa = F-1(a)
et xa est alors défini
comme l'abscisse telle que Pr{x
xa}.
Certains auteurs définissent xa par Pr{x
> xa}. Cette ambiguïté n'est pas gênante, le contexte
rendant en général clair le choix de la définition utilisée.
-----
En général, les quantiles ne sont pas calculables par des expressions mathématiques simples, et doivent être calculés une fois pour toutes par des formules approximatives (mais de précision largement suffisante pour les applications). Les valeurs sont dites "tabulées", et regroupées dans des tables (ou dans les logiciels) permettant, pour les distributions classiques, de retrouver la valeur du quantile correspondant à une aire donnée a.
-----
La notion de quantile est essentielle à l'estimation par intervalle et aux tests. Les deux reposent sur la possibilité d'établir que la valeur d'une certaine statistique a une probabilité inférieure à une valeur arbitrairement choisie a d'être en dehors d'une certaine plage, dont les limites sont directement liées aux quantiles de la distribution de cette statistique.
Par exemple, soit m la moyenne d'un échantillon issu d'une distribution normale de variance connue s² mais de moyenne µ inconnue. Cette moyenne empirique m est utilisée comme estimation de µ. L'intervalle de confiance au niveau de confiance (1-a) de cette estimation est défini par (voir ici) :

où za /2 est la notation traditionnelle du quantile d'ordre (1 - a /2) pour la distribution normale standard.

La notion de quantile s'applique également aux échantillons (ou à tout ensemble fini de points).
La notion de quantile permet de donner des représentations visuellement très instructives :
Une amélioration du Q-Q plot, le diagramme Quantile Interquartile ("QIQ plot"), permet d'évaluer l'adéquation d'un échantillon à une distribution théorique en se débarassant des influences de la tendance centrale et de la dispersion de l'échantillon.
Ces questions sont développées dans le premier Tutoriel ci-dessous.
________________________________________________________
|
Tutoriel 1 |
Un "diagramme Quantile-Quantile", ou "Q-Q Plot" est un graphique permettant de comparer visuellement :
Dans ces deux applications, le jugement de l'analyste est essentiel, et les conclusions tirées de l'examen d'un Q-Q plot ont donc nécessairement un caractère subjectif. Seuls des tests peuvent infirmer l'hypothèse de normalité d'une distribution qui n'est connue que par un échantillon, ou de l'identité des distributions derrière deux échantillons. Par contre, ces tests sont incapables de mettre en évidence certaines caractéristiques essentielles des échantillons, que l'œil exercé du praticien décèlera sans peine dans un Q-Q plot.
DIAGRAMME QUANTILES-QUANTILES ou "Q-Q plot"
|
Ajustement d'une distribution de référence à un échantillon Standardisation des données Pourquoi les quantiles ? Le Q-Q plot Rankit plot Comparer deux échantillons |
||
|
TUTORIEL |
||
________________________________________________________________
|
Tutoriel 2 |
La transformation appelée "Quantile Inter-quartile" (transformation QIQ) a pour objet de comparer la forme d'une distribution empirique à une distribution théorique qui n'est pas complètement spécifiée (comme une distribution Normale, sans spécifier la moyenne µ ni la variance s²).
De plus, la transformation QIQ peut être utilisée pour classer les ailes d'une distribution empirique en "longue", "moyenne" ou "courte", ce qui facilite le choix d'une distribution théorique de référence.
Avant d'aborder la transformation QIQ proprement dite, il est important de comprendre deux concepts statistiques assez peu connus sur lesquels repose la tranformation QIQ : la fonction mi-distribution et la fonction quantile continue.
TRANSFORMATION QUANTILE INTER-QUARTILE
|
La fonction mi-distribution La fonction quantile continue La transformation Quantile Inter-quartile |
||
|
TUTORIEL |
||
|
Nous remercions M. Matthew BATES pour ce Tutoriel |
_________________________________________________________
|
Etude de cas |
L'étude décrit un problème industriel réel. Un fabricant d'automobiles est confronté au problème d'avoir à assembler deux pièces mécaniques usinées indépendamment. Si l'assemblage se fait mal, les pièces doivent être réusinées, une circonstance coûteuse dont il convient donc de réduire la probabilité.
L'étude identifiera :
* La nature des distributions de probabilité des dimensions des deux pièces concernées. Cette identification se fera par transformation QIQ (voir ci-dessus) sans avoir recours à l'estimation de paramètres de tendance centrale ou de dispersion des distributions candidates.
* Les paramètres de ces distributions seront alors estimés à partir des données.
* Une simulation numérique permettra enfin de déterminer les réglages des machines d'usinage des pièces permettant de minimiser la probabilité de mauvaise adaptation entre deux pièeces tirées au hasard.
ETUDE DE CAS : CONTRÔLE DE PROCESSUS INDUSTRIEL
|
Le problème Les données La solution Identification des distribution par QIQ-plot Estimation des paramètres des distributions Normale Exponentielle Moyenne Limite inférieure Simulation des distributions Optimisation des paramètres d'usinage |
||
|
ETUDE DE CAS |
||
|
Nous remercions M. Matthew BATES pour cette Etude de Cas |
____________________________________
Voir aussi: