Théorème de Bayes
Prononcer "Baï-ze".
Aussi connu sous le nom de "Règle de Bayes"
ou "Formule de Bayes".
Un résultat très important de théorie des Probabilités.
Le cas discret
Nous présentons d'abord le théorème de Bayes dans le contexte de la classification. Supposons qu'il faille affecter des observations à des classes sur la base de mesures faites sur l'unique attribut x, supposé prendre des valeurs discrètes x(l).
_____
Le théorème de Bayes permet de relier ces quatre quantités. Il s'exprime par la formule:
|
|
Donc ce que dit le théorème de Bayes est:
" Vous voulez savoir à quelle classe appartient une nouvelle observation en mesurant x ? Vous ne le saurez jamais avec certitude, mais, pour chacune des classes Ck , vous pouvez améliorer votre estimation initiale P{Ck}de la probabilité d'appartenance à la classe en la transformant en P{Ck| x(l)}, qui tient compte du résultat de la mesure.
Pour cela, pour chaque classe:
* Prenez la probabilité a priori P{Ck}de la classe.
* Multipliez la par P{x(l) | Ck}, la probabilité conditionnelle de classe pour la valeur x(l) de l'attribut,
* et divisez le résultat par P{x(l)}, la probabilité inconditionnelle de la valeur de l'attribut. Ce nombre est le même pour toutes les classes, et ne dépend que de l."
__________________
Le dénominateur P{x(l)} joue le rôle d'un facteur de normalisation. Pour s'en convaincre, on additionne toutes le probabilités a posteriori pour obtenir:

En effet, une observation appartient forcément à une classe et à une seule, et la somme des probabilités d'appartenance aux classes est donc égale à 1.
Remplaçons chaque terme de la somme par son expression donnée par la formule de Bayes. Nous obtenons:

La formule de Bayes s'écrit maintenant:

où le dénominateur apparaît clairement comme un facteur de normalisation.
Le cas continu
La formule de Bayes n'est que
légèrement modifiée si x est une variable continue. La définition des
probabilité a priori est bien sûr inchangée. Mais:
* Les probabilités inconditionnelles P{x(l)} doivent être remplacées par la densité (de probabilité) inconditionnelle p(x), qui est la fonction de densité de probabilité de x quand les étiquettes de classe ne sont pas prises en compte.
* Les probabilités conditionnelles de classe P{x(l) | Ck}doivent être remplacées par les densités (de probabilité) conditionnelles de classes p(x|Ck). Chacune de ces k densités est la ddp de x pour la population d'une classe quand les autres classes sont ignorées.
La formule de Bayes devient alors:
|
|
La formulation générale
Le théorème de Bayes ne se limite pas à la seule classification. Sa formulation générale est une des bases de la Théorie des Probabilités, et ne fait référence ni à la classification ni à aucune autre application particulière.
Elle s'énonce ainsi:
* Si A est un évènement quelconque,
* et si {B1, B2, ..., Bn} est un ensemble d'évènements à la fois exhaustifs et mutuellement exclusifs,
alors pour tout i:

Nous pouvons considérer P{Bi}comme une évaluation initiale de la vraisemblance de l'évènement Bi. Si l'évènement A se produit, alors nous pouvons affiner cette estimation en la remplaçant par P{Bi | A }.
____________________________________________________________________________________