Poisson (Processus de)
Les intervalles de temps séparant deux "tops" consécutifs d'une bonne horloge sont, par définition, égaux.
Considérons maintenant une horloge aléatoire : après chaque top, l'horloge tire une réalisation x d'une variable aléatoire X, et attend x secondes avant d'émettre le top suivant.
Si X est une variable exponentielle de distribution Exp(λ), l'horloge s'appelle un processus de Poisson pour des raisons qui apparaîtront clairement dans quelques instants.
Cette animation illustre le concept de processus de Poisson.
|
|
* Le rectangle jaune sur la gauche de l'animation est l' "horloge aléatoire". Faites glisser le curseur dans le cadre rose pour changer la valeur de λ. * Cliquez sur "Go",
et observez un processus de Poisson en action. |
Suivant la présentation standard des processus stochastiques, nous considérons une suite infinie {Xn } de variables aléatoires indépendantes et identiquement distribuées prenant des valeurs non négatives. Ces variables sont appelées "durées de vie" ou "durées séparant deux évènements", ou "inter-arrivées".
* Notons Tn la date à laquelle se produit le nème évènement. C'est une variable aléatoire.
Nous avons :
T0 = 0
Tn = X1 + X2 + ... + Xn

* Pour une date donnée t, nous notons N(t) le nombre d'évènements se produisant dans l'intervalle de temps ]0, t]. C'est une variable aléatoire dont définition formelle est :
N(t) = max (n ≥ 0 : Tn ≤ t}
c'est à dire :
"Le numéro du dernier évènement se produisant avant t"
* Finalement, nous notons
{N(t), t ≥ 0}
la suite (continuement infinie) de variables aléatoires N(t) indexée par t, et appelons cette suite un processus de comptage.
Si toutes les Xi sont des Exp(λ) indépendantes et identiquement distribuées (iid), le processus de comptage s'appelle un processus de Poisson d'intensité λ, et sera noté PP(λ).
Le choix de la distribution exponentielle pour les Xi peut sembler quelque peu arbitraire, mais nous verrons que les processus de Poisson ont des propriétés uniques qui en font le modèle de choix pour représenter des occurences d'évènements aléatoires se produisant un par un (voir ci-dessous).
La moyenne µ de la distribution Exp(λ) est égale à 1/λ. Donc λ est le nombre moyen d'évènements se produisant dans une unité de temps.
Inversement, µ = 1/λ est le temps moyen séparant deux évènements consécutifs (voir animation).
Les {Xn } étant iid Exp(λ), Tn suit la distribution Γ(n, 1/λ) (voir ici).
Une façon commode de visualiser la réalisation d'un processus de Poisson (ou tout autre processus de comptage) est sa trajectoire :

Tous les intervalles de temps (Ti + 1 - Ti ) entre évènements consécutifs sont des variables Exp(λ) indépendantes.
-----
Une trajectoire est donc la représentation graphique d'une réalisation particulière d'un processus de Poisson. C'est l'équivalent, pour les processus stochastiques, de la réalisation d'une variable aléatoire (observation).
Le nombre k d'évènements se produisant dans l'intervalle initial ]0, t] est une variable aléatoire N(t).
Nous montrerons que :
|
|
N(t) est donc une variable de Poisson, ce qui justifie le nom "processus de Poisson".
* Invariance d'un PP(λ) par translation de l'origine des temps
Soit s > 0 une date fixe, et considérons les évènements se produisant après s.

Notons Ns(t) le nombre d'évènements se produisant durant la période ]s, s + t].
Un nouveau processus de comptage {Ns(t), t ≥ 0} peut être défini à partir de s (au lieu de 0 pour {N(t), t ≥ 0}).
Nous montrerons que :
|
{Ns(t), t ≥ 0} est également un PP(λ). |
En d'autres termes, changer l'origine des temps ne change pas la nature PP(λ) d'un processus de Poisson.
-----
Ce résultat d'apparence inoffensive est en réalité très fort, et est une conséquence de la propriété d'absence de mémoire de la distribution exponentielle (que cette distribution est la seule à posséder).
* Indépendance du processus et du processus décalé
Pour un t > s donné, Ns(t) est une variable aléatoire. Soit u une date antérieure à s (u < s).

Le nombre d'évènements N(u) est une variable aléatoire.
Nous montrerons que :
|
Ns(t) et N(u) sont indépendantes |
Les nombres d'évènements :
* Dans un intervalle initial,
* Et dans un intervalle sans recouvrement avec cet intervalle initial,
sont donc des variables aléatoires indépendantes.
Pour un intervalle donné ]t, t + Δt], le nombre d'évènements se produisant dans cet intervalle s'appelle un accroissement (ou "incrément") du processus. Les accroissements d'un processus de comptage sont dits stationnaires si la distribution d'un accroissement ne dépend que de la durée Δt et pas de l'origine t de l'intervalle de temps considéré.
Nous montrerons que les deux résultats précédents conduisent aux deux propriétés suivantes d'un processus de Poisson :
|
1) Les accroissements d'un processus de Poisson sont stationnaires. 2) Les accroissements d'un processus de Poisson dans deux intervalles disjoints sont indépendants. |
Ces deux propriétés sont illustrées par les images supérieure et inférieure de la figure ci-dessous :
Les accroissements de deux intervalles disjoints sont indépendants, mais les accroissements de deux intervalles se chevauchant ne le sont évidemment pas. Malheureusement, le calcul de la covariance de ces deux v.a. est inextricable.
Cependant, dans le cas particulier de deux intervalles initiaux ]0, t] et ]0, t + s], nous montrerons que :
|
Cov(N(t), N(t + s)) = λt |

Remarquez que le résultat ne dépend pas de s. La covariance de deux accroissements initiaux ne dépend donc que de la durée du plus court des des deux intervalles (et bien sûr de λ).
_________
En raison de l'invariance par translation dans le temps d'un processus de Poisson, ce résultat s'applique à toute paire d'intervalles partageant la même origine.
La stationnarité et l'indépendance des accroissements nous conduiront à une propriété caractéristique d'un processus de Poisson (et qui est donc utilisable comme deuxième définition d'un PP).
Nous montrerons que
|
Un processus de comptage est un processus de Poisson PP(λ) si et seulement si : * Ses accroissements sont stationnaires et indépendants. * N(t) ~ Poisson(λt) |
Il faut donc remarquer que la seule condition N(t) ~ Poisson(λt) n'est pas suffisante pour qu'un processus de comptage {N(t), t ≥ 0} soit un processus de Poisson.
La première définition d'un processus de Poisson énonce que les durées entre évènements consécutifs sont des variables exponentielles iid.
La seconde définition utilise la stationnarité et l'indépendance des accroissements, ainsi que la distribution Poisson(λt) des accroissements initiaux.
Nous décrivons maintenant une nouvelle propriété caractéristique des processus de Poisson, et qui peut donc être utilisée comme une troisième définition. Elle est d'une nature assez différente de celles de deux premières, et sensiblement moins intuitive.
La nature "Poisson" de la distribution des incréments initiaux est une conséquence directe de notre choix de la distribution exponentielle pour définir les durées séparant deux évènements consécutifs. Si nous avions choisi une distribution autre que la distribution exponentielle, les incréments initiaux auraient eu une autre distribution f(k, t).
Supposons que f(k, t) admette un développement limité à l'ordre 1 (une condition très faible), alors :
f(k, t) = f(k, 0) + f '(k, 0)t + o(t)
où o(t)/t → 0 avec t.
Nous examinons maintenant les probabilités d'avoir respectivement 0, ou bien 1, ou bien plus de 1 évènement dans ]0, t].
* k = 0
Nous avons
P{N(t) = 0} = f(0, t) = f(0, 0) + f '(0, 0)t + o(t)
Nous supposons que le processus considéré est un processus de renouvellement dit "pur", c'est à dire avec une probabilité nulle d'observer un évènement en t = 0. En conséquence :
f(0, 0) = 1
* k = 1
Nous avons
P{N(t) = 1} = f(1, t) = f(1, 0) + f '(1, 0)t + o(t)
La probabilité d'avoir exactement 1 évènement dans l'intervalle ]0, t] doit tendre vers 0 avec t, et donc
f(1, 0) = 0
* k > 1
Nous considérons maintenant la probabilité d'avoir plus d'1 évènement dans ]0, t].
Nous avons
|
P{N(t) > 1} |
= 1 - P{N(t) = 0} - P{N(t) = 1} |
|
|
= 1 - (1 + f '(0, 0)t) - f '(1, 0)t + o(t) |
|
|
= -(f '(0, 0) + f '(1, 0))t + o(t) |
qui est de l'ordre de t : pour des petites valeurs de t, cette probabilité est approximativement proportionnelle à t.
* Cas particulier
Considérons le cas particulier où la distribution f(k, t) du nombre d'évènements dans un intervalle initial ]0, t] est telle que :
f '(0, 0) = - f '(1, 0)
Alors
P{N(t) > 1} = o(t)
La probabilité d'observer maintenant plus d'1 évènement dans l'intervalle de temps ]0, δt] devient alors négligeable par rapport à la probabilité (qui est de l'ordre de δt) d'observer 1 évènement dans cet intervalle : il y a un effet rendant extrêmement improbable l'observation de plusieurs évènements dans un intervalle de temps très petit (bien que les durées entre évènements soient indépendantes).
Bien sûr, la première question est : existe-t-il des distributions f(k, t) telles que f '(0, 0) = - f '(1, 0) ?
Nous vérifierons facilement que la distribution Poisson(λt) remplit effectivement cette condition. Un PP a donc la propriété d' "anti-agglomération".
Mais nous montrerons également que les PP(λ) sont les seuls processus de comptage ayant cette propriété, pour peu que l'on ajoute les conditions de stationnarité et d'indépendance des accroissements.
-----
Notons λ = f '(0, 0) = - f '(1, 0). Alors :
* P{N(t) = 0} = 1 - λt + o(t),
* P{N(t) = 1} = λt + o(t).
Nous montrerons que :
|
||||
où o(t) est tel que o(t)/t tend vers 0 avec t.
La perception intuitive d'un processus de Poisson peut être facilitée par l'expérience de pensée suivante. La droite temporelle de 0 à l'infini est divisée en tranches de durée δt. Vous marchez le long de cette ligne à partir de t = 0 et à chaque pas (de longueur δt), vous lancez une pièce de monnaie ayant la probabilité λδt de retomber sur "Pile". Chaque occurence de "Pile" est considérée comme un "évènement".

Le nombre de lancers entre deux évènements suit, par définition, la distribution géométrique de paramètre λδt. En raison de l'absence de mémoire de la distribution géométrique, les nombres de lancers entre évènements consécutifs sont des variables aléatoires indépendantes.
Lorsque δt tend vers 0, nous savons que la distribution limite de la distribution géométrique de paramètre λδt est la distribution Exp(λ).
Donc, à la limite δt → 0, les nombres de lancers entre évènements consécutifs sont Exp(λ) et indépendantes.
Soit N un entier. La distribution du nombre d'évènements dans tout segment de N pas de long est la distribution binomiale B(N, λδt). Quand δt tend vers 0 et que la longueur du segment est maintenue constante (N.δt = t = constante ), nous savons que la distribution limite de B(N, λδ t) est Poisson(λt). Ainsi, à la limite, les accroissements dans un intervalle de temps de durée t suivent la distribution Poisson(λt) et sont donc stationnaires.
Par la propriété d'absence de mémoire de la distribution géométrique, les accroissements dans des intervalles de temps ne se chevauchant pas sont indépendants.
Par construction, chaque tranche de temps contient soit 0 soit 1 unique évènement, mais jamais 2 ou plus. C'est dans cette propriété qu'il faut rechercher l'inspiration conduisant au deuxième ensemble de conditions de la troisième définition d'un processus de Poisson.
Soit t une date fixe, et considérons celles des réalisations d'un processus de Poisson PP(λ) pour lesquelles le nombre d'évènements dans ]0, t] est exactement égal à un nombre donné n. Les dates T1, T2, ..., Tn auxquelles ces évènements se produisent sont des variables aléatoires, qui ont une densité de probabilité conjointe f(t1, t2, ..., tn ).
Nous montrerons que, conditionnellement à N(t) = n :
|
* * 0 sinon. |
Remarquez que λ n'apparaît pas dans
ce résultat.
Nous reconnaissons la distribution de probabilité conjointe des statistiques d'ordre de la distribution uniforme dans [0, t] pour des échantillons de taille n.
Donc, conditionnellement à N(t) = n, les évènements dans l'intervalle de temps ]0, t] sont uniformément distribués. Bien entendu, en raison de l'invariance d'un PP par changement de l'origine des temps, ceci est également vrai pour tout intervalle [s, s + t].
-----
Ce résultat reçoit différentes interprétations selon le contexte. Par exemple :
1) Considérons une liste de dates auxquelles se sont produits des évènements au cours d'une certaine période. S'il est avéré que ces évènements ont été engendrés par un PP, alors ces dates peuvent être analysées sans jamais faire référence à la notion de processus de Poisson : il est tout aussi correct de les considérer comme ayant été tirées d'une distribution uniforme sur la même période.
2) Pour simuler un processus de Poisson PP(λ) sur un intervalle de temps ]0, t], répéter la procédure suivante :
* Tirer un entier n de la distribution Poisson(λt),
* Puis tirer n observations de la distribution Uniforme(0, t).
Nous considérons maintenant des situations impliquant plusieurs processus de Poisson :
1) La superposition de plusieurs processus de Poisson dans un unique processus de comptage, qui s'avèrera être également un processus de Poisson.
2) Et dans la section suivante, la division (ou "thinning") d'un processus de Poisson en plusieurs processus de comptage selon une procédure qui garantira que les sous-processus ainsi créés sont également des processus de Poisson.
Pour des raisons de simplicité, nous ne considérons que la superposition de deux processus de Poisson. Par exemple, il peut s'agir :
* D'un flux sur une branche d'autoroute décrit par le processus P1 d'intensité λ1.
* Et d'un flux sur une autre branche décrit par le processus P2 d'intensité λ2.

En aval de la rencontre des deux branches, le flux d'automobiles est un nouveau processus de comptage.
Nous montrerons que, sous réserve de l'indépendance des deux flux incidents, le flux résultant de la fusion est encore un processus de Poisson dont l'intensité λ est égale à la somme des intensités des flux incidents :
|
λ = λ1 + λ2 |
Ce résultat se généralise simplement à un nombre quelconque de processus de Poisson.
Supposons que nous superposions n processus de Poisson.
Nous montrerons que dans le processus résultant de la superposition, chaque évènement provient du processus k avec la probabilité
|
|
On remarque que :
1) La probabilité pour qu'un évènement provienne d'un processus donné ne dépend aucunement des appartenances des évènements précédents aux divers processus.
2) En moyenne, le nombre d'évènements provenant d'un processus donné est proportionnel à l'intensité de ce processus, un résultat très intuitif.
Nous considérons maintenant la situation inverse : un flux d'évènements décrit par un processus de Poisson PP(λ) va être divisé en deux flux (ou plus). Pensez par exemple au standard téléphonique d'une entreprise recevant un flux poissonnien d'appels : certains appels seront pour le Service Commercial, alors que d'autres seront pour la Comptabilité (ainsi que pour d'autres services dans l'entreprise).

Lorsque nous avons considéré la superposition de processus de Poisson, il n'y avait pas besoin de préciser comment s'opérait la fusion car il n'y a en fait qu'une seule façon raisonnable de l'effectuer. Mais maintenant, nous devons décrire le mécanisme par lequel les évènements sont orientés soit vers P1 soit vers P2.
Nous décrivons le plus simple des mécanismes de division : lorsqu'un nouvel évènement se présente, une pièce de monnaie (biaisée) est lancée, et selon qu'elle retombe sur Pile ou sur Face, l'évènement est orienté vers P1 ou vers P2.
Bien sûr, on ne s'attend pas à ce que le standard oriente les appels entrants au hasard (bien que, parfois...) : dans cet exemple, le caractère aléatoire de la division est dans la nature de l'appel, et existe donc avant l'orientation effective de l'appel.
Nous montrerons que P1 et P2 sont tous les deux des processus de Poisson, un résultat qui n'est pas absolument évident. Les intensités respectives de P1 et de P2 étant notées λ1 et λ2, nous obtiendrons
|
* λ1 = pλ * λ2 = (1 - p)λ |
où p est la probabilité pour que le mécanisme de Bernoulli oriente l'évènement vers P1.
Ce résultat se généralise simplement à un nombre quelconque de sous-processus.
-----
Nous montrerons que les deux sous-processus obtenus par la division sont indépendants. Rappelons que ceci signifie que pour tout intervalle de temps
Δt après la séparation, les nombres d'évènements provenant de P1 ou de P2 , soient N1(Δt) et N2(Δt) sont des variable aléatoires indépendantes.

Bien que non surprenant, ce résultat n'est pas aussi intuitif que le précédent. C'est essentiellement ce résultat d'indépendance qui rend le mécanisme de Bernoulli très attractif pour la description de la division d'un processus de comptage.
Le résultat se généralise à un nombre quelconque de sous-processus après la division.
Dans le paragraphe précédent, le paramètre p du mécanisme de Bernoulli était supposé constant. Que se passe-t-il s'il varie au cours du temps, et que nous devions donc écrire p(t) au lieu de p ? Il semble que plus rien ne subsite de l'étude précédente, et qu'on ne puisse rien dire des sous-processus après division.
En fait, il est vrai que les sous-processus ne sont plus des processus de Poisson, mais ils bénéficient malgré tout de deux des trois caractéristiques d'un PP :
* La distribution du nombre d'évènements dans tout intervalle ouvrant (0, t] est encore une variable de Poisson.
* Les accroissements d'un sous-processus sont encore indépendants.
Ce qui est perdu est la stationnarité des accroissements.
-----
Plus précisément, le nombre d'évènements de P1 dans (0, t] suit la distribution Poisson(λpt) dans le cas du mécanisme homogène. La quantité pt peut s'écrire de façon inutilement compliquée :
qui met simplement l'accent sur le fait que toutes les tranches infinitésimales de temps dt sont "pondérées" par le "poids" constant p.
Nous montrerons que la distribution du nombre d'évènements du mécanisme homogène, soit

doit être maintenant remplacée par
|
|
où

Ainsi, le nombre d'évènements dans un intervalle ouvrant (0, t] suit encore une distribution de Poisson avec une pseudo-intensité αλ, où α est la valeur moyenne de p(t) dans l'intervalle de temps considéré.
________________________________________________________________________________
|
Tutoriel 1 |
Dans ce Tutoriel, nous établissons qu'un processus de comptage est un processus de Poisson si et seulement si :
* Le nombre d'évènements dans tout intervalle initial ]0, t] suit la distribution Poisson(λt).
* Et si ses accroissements sont stationnaires et indépendants.
Il nous faudra pour cela établir un certain nombre de résultats préliminaires :
* Le nombre d'évènements dans un intervalle initial ]0, t] d'un PP(λ) suit la distribution Poisson(λt).
* Changer l'origine des temps d'un PP(λ) ne change pas sa nature PP(λ), un résultat fondamental.
* Les accroissements d'un PP(λ) sont stationnaires.
* Les accroissements d'un intervalle initial et ceux d'un intervalle ne le chevauchant pas sont indépendants, un résultat que nous généraliserons ensuite à toute paire d'intervalles disjoints.
-----
Il nous sera alors possible d'établir l'équivalence entre la définition originale d'un PP(λ), et la deuxième définition telle qu'énoncée plus haut.
DEUXIEME DEFINITION D'UN PROCESSUS DE POISSON
|
Nombre d'évènements dans un intervalle de temps initial Changement de l'origine des temps Invariance d'un PP par changement de l'origine des temps Indépendance d'un PP et du même PP après changement d'origine Accroissements Les accroissements sont stationnaires Les accroissements sont indépendants Deuxième définition d'un processus de Poisson Les conditions sont nécessaires Les conditions sont suffisantes |
||
|
TUTORIEL |
||
_____________________________________________________________
|
Tutoriel 2 |
Nous montrons maintenant qu'un processus de comptage est un processus de Poisson d'intensité λ si et seulement si :
* Ses accroissements sont
stationnaires et indépendants.
* N(0) = 0 et
- P{N(t) = 0} = 1 - λt + o(t)
- P{N(t) = 1} = λt + o(t)
- P{N(t) > 1} = o(t)
Cet ensemble de conditions apparaîtra donc comme une troisième définition d'un processus de Poisson.
-----
Il est facile de montrer qu'un processus de Poisson vérifie ces conditions.
La réciproque est un peu plus délicate. Nous montrerons que ces conditions conduisent à un système d'équations différentielles récursives reliant P{N(t) = k} à P{N(t) = k + 1}. Nous intégrerons ce système et découvrirons ainsi que N(t) suit la distribution Poisson(λt). Il sera alors aisé d'en conclure que le processus défini par les conditions ci-dessus est un PP(λ).
PROPRIETE D'ANTI-AGGLOMERATION
TROISIEME DEFINITION D'UN PROCESSUS DE POISSON
|
Les conditions sont nécessaires k = 0 k = 1 k ≥ 2 Les conditions sont suffisantes Les equations différentielles k ≥ 1 k = 0 Intégration des équations différentielles k = 1 k ≥ 1 par récurrence Equivalence avec la deuxième définition |
||
|
TUTORIEL |
||
____________________________________________
|
Tutoriel 3 |
Dans ce Tutoriel :
1) Nous calculons la covariance des nombres d'évènements apparaissant dans deux intervalles partageant la même origine.
2) Nous abordons ensuite l'importante question de la distribution conjointe des temps d'arrivée dans ]0, t] conditionnellement au nombre n des évènements dans cet intervalle. Nous montrerons que cette distribution est identique à la distribution conjointe des statistiques d'ordre de la distribution uniforme dans [0, t] pour des échantillons de taille n.
-----
Cette table des matières est courte, mais le Tutoriel ne l'est pas. Les deux questions abordées, sans être véritablement difficiles, demandent à être exposées avec une certaine prudence.
DEUX PROPRIETES DES PROCESSUS DE POISSON
|
Covariance des nombres d'évènements dans deux intervalles initiaux Propriété d'uniformité d'un processus de Poisson |
||
|
TUTORIEL |
||
__________________________________________________________________
|
Tutoriel 4 |
Dans ce Tutoriel, nous commençons par montrer que lorsque deux processus de Poisson indépendants sont superposés, le processus de comptage résultant est également un processus de Poisson dont nous établirons les propriétés.
Nous examinons ensuite la situation inverse : un flux d'évènements décrits par un procesus de Poisson est divisé au vol en deux branches selon les valeurs prises par une variable de Bernoulli. Nous montrerons que les sous-processus ainsi obtenus sont des processus de Poisson dont nous établirons les propriétés.
Finalement, nous montrerons que si la valeur du paramètre de la variable de Bernoulli varie dans le temps, les sous-processus résultant de la division du processus initial ne sont plus des processus de Poisson, mais conservent cependant la propriété d'avoir des nombres d'évènements dans des intervalles de temps initiaux qui suivent des distributions de Poisson. Seule la stationnarité des accroissements est perdue par la variation du paramètre de Bernoullli.
SUPERPOSITION DE PROCESSUS DE POISSON
"THINNING" D'UN PROCESSUS DE POISSON
|
Superposition de processus de Poisson La superposition est un processus de Poisson Les accroissements sont indépendants Les accroissements sont stationnaires Les accroissements ont des distributions de Poisson L'intensité est la somme des intensités Entrelacement des évènements Division d'un processus de Poisson Les sous-processus sont de Poisson Les durées entre évènements sont exponentielles Les durées entre évènements sont indépendantes Les sous-processus sont des processus de Poisson Les sous-processus sont indépendants Mécanisme de Bernoulli inhomogène |
||
|
TUTORIEL |
||
___________________________________________________
Voir aussi :