Animation interactive

Discriminant (linéaire) de Fisher

(Aussi connu sous le nom de "Droite discriminante de Fisher").
 

Ce nom est un peu trompeur : le discriminant linéaire de Fisher n'est pas un classifieur à proprement parler, mais plutôt une technique de réduction de dimensionalité. Cependant, un authentique classifieur peut s'en déduire facilement.

 

La réduction de dimensionalité est une des questions centrales de la modélisation statistique de données. Rappelons que le problème est de représenter les données avec aussi peu de variables que possible, tout en perdant aussi peu d'information que possible.

  

 

Supposons que nous retenions x1. Ceci veut dire que tous les points sont projetés sur l'axe x1, ou, de façon équivalente, que la variable x2 est ignorée. Le classifieur est alors simplement :

 

La figure montre que ce classifieur est très mauvais, en raison du chevauchement considérable des projections de C1 et C2 sur x1. Toute valeur du seuil S0 conduira à un taux de mauvaise classification très élevé.

Malheureusement, retenir x2 et rejeter x1 est également une mauvaise solution pour des raisons similaires.

 

Nous sommes donc dans une situation où toute sélection de variable est pire que pas de sélection du tout. La réduction de dimensionalité semble donc impossible, parce que trop d'information est perdue en éliminant l'une ou l'autre variable.

 

Il est pourtant facile de construire un classifieur parfait (image inférieure de l'illustration ci-dessus) : il suffit de projeter les classes sur la droite bleue F. Les deux classes projetées sont alors complètement séparées, et il est facile de trouver un seuil S0 qui conduise la règle d'affectation précédente à un taux de mauvaise classification nul.

 

Ce classifieur est-il à 1, ou bien à 2 variables ?

 

Nous avons donc trouvé une technique de réduction de dimensionalité plus complexe que la simple sélection de variables, mais aussi plus puissante. Le discriminant de Fisher n'est que la formalisation de cet exemple.

-------

 

Sous sa forme originale, le discriminant de Fisher concerne :

 

Idéalement, nous voudrions donc disposer d'une "mesure de chevauchement" entre deux ensembles de points, et identifier la direction de projection qui rende la valeur de cette mesure maximale. Malheureusement, il n'existe pas de mesure simple et élégante de chevauchement, et nous devrons donc nous satisfaire de la définition critère dont la valeur :

 

en espérant que des classes projetées compactes et dont les barycentres sont loins l'un de l'autre ne se chevauchent que peu.

 

En général, "distance entre les projections des barycentres" et "compacité des classes" ne peuvent pas être rendues maximales simultanément (c'est à dire, pur une même direction de projection). Le critère de Fisher J réalise un compromis entre ces deux objectifs.

Le discriminant de Fisher F est la direction de l'espace qui rend le critère de Fisher maximal. Il est en général unique.

 

Une fois le discriminant de Fisher identifié, il est de la responabilité de l'utilisateur de trouver la valeur S0 du seuil qui conduira au taux minimal de mauvaise classification. Le discriminant de Fisher est alors devenu un authentique classifieur.

--------------

 

Le critère de Fisher est défini de façon heuristique, et le discriminant de Fisher ne peut donc pas prétendre être toujours le meilleur sous-espace linéaire de projection (dans un objectif final de classification). En fait, il existe d'autres critères de "projection optimale de classe", qui sont occasionnellement utilisés au lieu du critère de Fisher.

Il existe cependant un cas où le critère de Fisher est optimal : cest celui où les deux classes sont multinormales avec des Matrices de Covariances identiques. Le classifieur qui en découle est alors identique à celui obtenu par la minimisation des erreurs quadratiques. Le seuil S0 est alors également fourni par la théorie, et n'a plus besoin d'être ajusté "à la main".

-------

 

Le discriminant de Fisher est le premiers pas sur le chemin conduisant à l'Analyse Discriminante.

 

Des frontières linéaires ou quadratiques par morceaux peuvent alors être définies entre les classes, ce qui partitionne l'espace en régions, chaque région étant affectée à une classe.

____________________________________________________________

 

 

Tutoriel 1

 

Ces questions sont traitées en détail dans le Tutoriel suivant.

Nous expliquons dans un premier temps les raisonnements menant à la définition du critère de Fisher, dont nous donnons deux formes :

 

Nous montrons ensuite comment trouver la droite de Fisher en maximisant le critère de Fisher.

 

 

CRITERE DE FISHER ET DROITE DISCRIMINANTE DE FISHER

Le critère de Fisher J

La distance entre barycentres ne suffit pas

Variance de la projection d'un nuage de points, matrice de covariance

Dispersion des projections des classes et matrice de covariance "intra-classe"

Le critère de Fisher

Autre forme du critère de Fisher, matrice de covariance "inter-classe"

Le vecteur de Fisher

Dérivée d'une forme quadratique (résultat seulement)

Maximisation du critère de Fisher, le vecteur de Fisher

La droite de Fisher est-elle optimale ?

Classification et discriminant de Fisher

Séparabilité des classes

TUTORIEL

__________________________________________________

 

Tutoriel 2

 

Nous donnons ensuite quelques compléments mathématiques nécessaires pour la maximisation du critère de Fisher sous sa forme générale.

 

MAXIMISATION DE LA FORME GENERALE DU CRITERE DE FISHER

Dérivée d'une forme quadratique (démonstration)

Maximisation du rapport de deux formes quadratiques

Cas général

Application au critère de Fisher

TUTORIEL

 

________________________________________

 

Voir aussi:

Matrice de Covariance

Analyse Discriminante

 

Téléchargez ce Glossaire