Record

Soit X une variable aléatoire ayant une densité de probabilité. Nous procédons à une suite illimitée de tirages d'observations de X et, de temps en temps, il arrivera que la valeur d'une observation soit supérieure à toutes les valeurs observées jusqu'ici : cette observation sera dite être un record, et sa valeur une "valeur record".

Distribution d'une valeur record

Cette animation illustre le concept de "valeur record".

    * Le cadre supérieur affiche une distribution exponentielle. C'est la distribution dont nous allons tirer des observations.

    * Le contrôle "Record order" affiche l'ordre du record dont nous allons étudier la distribution.

        - La première observation est évidemment un record, bien que trivial. C'est le record d'ordre 0.

        - Le record d'ordre 1 (ou "Premier record") est la première observation dont la valeur est supérieure à celle de la première observation.

        - Le record d'ordre 2 (ou "Deuxième record") est la première observation dont la valeur est supérieure à celle du record d'ordre 1.

        - ........................

        - Plus généralement, le record d'ordre n (ou "nième record") est la première observation dont la valeur est supérieure à celle du record d'ordre (n - 1).

 

Par défaut, l'ordre sélectionné est 3. Ceci veut dire que nous allons étudier la distribution du record d'ordre 3. Cette distribution est affichée dans le cadre inférieur.

 

 

Le "Livre des Animations" sur votre ordinateur

 

 

 

Tirages manuels

    * Cliquez sur "Next". La première observation est tirée. C'est le record trivial d'ordre 0, mais un record malgré tout et, en tant que tel, il est représenté par un point rouge.

    * Continuez à cliquer sur "Next". Chaque clic génère une nouvelle observation.

        - Si cette observation est plus petite que le record courant, elle est représentée par un point vert.

        - Mais si cette nouvelle observation est plus grande que le record courant, elle devient le nouveau record à battre et est représentée par un point rouge. Le record précédent reste affiché, mais sous la forme d'un point violet.

-----

Après que le record d'ordre 3 ait été tiré, l'affichage est réinitialisé, et une nouvelle séquence de tirages peut commencer.

Tirages automatiques

    * Cliquez sur "Go". Les observations sont maintenant tirées automatiquement, et l'histogramme de la distribution de l'ordre sélectionné se construit progressivement dans le cadre inférieur. Nous montrerons que cette distribution est une distribution Gamma.


L'échelle verticale est arbitraire, et est ajustée de façon à ce que la hauteur de la distribution Gamma soit toujours la même quel que soit l'ordre du record selectionné.

    * Cliquez sur "Reset", et sélectionnez l'option "Uniform". Nous étudions maintenant la distribution des records inférieurs de la distribution uniforme. Cette distribution est calculée dans le Tutoriel ci-dessous.

Cette animation triche !

Le piquant de cette animation vient de ce qu'elle triche, mais d'une façon honnête.

Tricher est indispensable. Car supposons qu'un record de la distribution exponentielle (d'ordre inférieur à l'ordre sélectionné) soit, par hasard, très grand. Alors vous pourrez rester assis devant votre écran d'ordinateur jusqu'à la fin des temps (comme celà nous est arrivé) en attendant le record suivant, et vous quitterez alors ce site plus tôt que nous le souhaiterions.

Mais nous montrerons que, à tout instant, il est possible de tirer une unique observation :

    * Qui batte le record courant,

    * Et dont la distribution soit identique à la distribution de l'authentique nouveau record, aurions-nous eu la patience d'attendre ce nouveau record.

L'argument repose sur la propriété d'absence de mémoire de la distribution exponentielle, et nous vous encourageons à le développer par vous-même.

-----

Remarquez que nous n'affirmons pas que la valeur de ce faux nouveau record est la même que celle de l'authentique nouveau record, seulement que leurs distributions sont les mêmes. Cette distinction est de même nature que celle rencontrée dans l'expérience de pensée justifiant la définition d'une statistique exhaustive.

 

    * Le contrôle "Tolerated failures" affiche le nombre de tirages honnêtes que nous acceptons avant de perdre patience. Si le record courant n'a toujours pas été battu à l'issue d'une série de tirages de longueur "Tolerated failures", alors l'observation suivante sera tirée selon la procédure évoquée ci-dessus, et sera considérée comme le nouveau record. De cette façon, nous n'avons jamais à attendre plus de ("Tolerated failures" + 1) tirages pour avoir un nouveau record, quelle que soit la valeur du record courant.

Ce contrôle peut être actionné à tout moment sans avoir à interrompre l'animation. Remarquez que, lorsque vous augmentez la valeur de "Tolerated failures", l'accumulation des records de l'ordre sélectionné devient plus lente et plus irrégulière.

-----

Il est également possible de "tricher" avec les records de la distribution uniforme, bien que celle-ci ne possède pas la propriété d'absence de mémoire. Nous expliquons dans le Tutoriel pourquoi il en est ainsi.

Le rôle de la distribution exponentielle

La distribution exponentielle joue un rôle central dans l'étude des records car il se peut que ce soit la seule distribution pour laquelle les distributions des records soient calculables directement.

Considérons maintenant une variable aléatoire continue quelconque X ayant une densité de probabilité. Comme la distribution exponentielle peut-elle aider à calculer les distributions de ses records ? La clé vient de ce que les deux distributions peuvent être mises en rapport par l'intermédiaire de la Transformation par Fonction de Répartition. Nous montrerons que cette remarque permet de calculer les distributions des records de toute variable aléatoire ayant une densité de probabilité.

Le résultat est le suivant :

    * Soit X une v.a. ayant la densité de probabilité f(x).

    * Et soit F(x) sa fonction de répartition.

 

Nous montrerons que la densité de probabilité fn(x) de son record d'ordre n est donnée par :

fn(x) = f(x)[-log(1 - F(x))]n / n!

Autres quantités intéressantes concernant les records

Nous n'avons évoqué que les distributions des records, parce que ce sont les seuls résultats qui peuvent être obtenus avec un effort raisonnable.

Mais il existe au moins deux autres questions importantes à propos des records :

    * Quelle est la distribution du temps séparant le record d'ordre n et le record suivant d'ordre (n + 1) ?

    * Quelle est la distribution du nombre de records observés dans l'intervalle de temps [t, t + Δt] ?

 

Malheureusement, même les résultats les plus simples relatifs à ces questions sont au-delà des limites de ce Glossaire.

____________________________________________________________________

 

 

Tutoriel

 

Dans ce Tutoriel :

    * Nous commençons par calculer la distribution du record d'ordre quelconque de la distribution exponentielle. Ce résultat est une conséquence directe de la propriété d'absence de mémoire de la distribution exponentielle.

Nous montrons ensuite comment ce résultat peut être mis à profit pour rendre plus rapide l'animation ci-dessus en permettant le tirage d'une unique observation qui batte le record courant, et dont la distribution soit identique à celle du nouveau record.

 

    * Nous montrons ensuite comment les distributions des records de la distribution exponentielle peuvent être utilisés pour calculer les distributions des records de toute v.a. admettant une densité de probabilité. Le résultat est donné ci-dessus.


La démonstration fait appel à un résultat difficile sur la fonction de répartition de la distribution Gamma que nous énoncerons sans démonstration.

    * Nous utiliserons alors ce résultat pour calculer les distributions des records de la distribution uniforme.

Nous montrerons également que, bien que la distribution uniforme ne soit pas sans mémoire, il est possible de trouver un raccourci permettant de rendre plus rapide l'animation. Ce raccourci est lié à la distribution "uniforme récursive" ("Broken Stick distribution").

 

 

 

 

DISTRIBUTIONS DES RECORDS

Records de la distribution exponentielle

La propriété d'absence de mémoire

Distribution du record d'ordre n

Accélération de l'animation "Exponentielle"

Distributions des records d'une variable aléatoire quelconque

La Transformation par Fonction de Répartition

Lien entre une distribution et la distribution exponentielle

Distributions des records d'une variable aléatoire quelconque

Records de la distribution uniforme standard

Distributions de probabilité des records

Accélération de l'animation "Uniforme"

La distribution "uniforme récursive" ("Broken Stick distribution")

TUTORIEL

 

____________________________________________________________

 

Voir aussi :

Distribution exponentielle

Distribution uniforme

Transformation par Fonction de Répartition

Statistiques d'ordre

Téléchargez ce Glossaire