FORMATION  "CLASSIFICATION"

 
 

* Faut-il accorder le prêt que demande cet emprunteur ?

* Quel modèle ce client va-t-il acheter ?

* Ce client a-t-il un potentiel à long terme ?

* Quels sont ceux de mes clients qui risquent de me quitter ?


Autant de questions, et bien d'autres encore, qui demandent d'affecter un individu à une catégorie (ou "classe"), si possible avec une probabilité, et si possible en identifiant ceux des attributs de l'individu les plus pertinents. Le Data Mining offre une large panoplie de méthodes de classification (voir ci-dessous le contenu de la formation). Le succès de leur mise en œuvre dépend pour une large part de la connaissance qu'a le praticien de leurs mécanismes.

 

Plan de la formation


Le problème général de la classification (supervisée)        

L'approche géométrique

            Frontière, fonctions discriminantes.

L'approche probabiliste

Théorème de Bayes et décision bayésienne.

Classifications probabilistes directe et indirecte.

L'Analyse factorielle discriminante

Exemple à deux classes : le critère de Fisher

Généralisation : notion d'axe discriminant

Projections discriminantes

Lien avec l'ACP

 

Construire un classifieur géométrique

Classement par distance aux centres

Classes normales

Changement de métrique : distance de Mahalanobis

Lois d'affectation linéaires et quadratiques

Estimation du taux de mauvaise classification

 

Construire un classifieur probabiliste

Classification probabiliste directe par régression sur indicatrices

Régression Linéaire Multiple sur indicatrices.

La Régression Logistique.

Les Réseaux de neurones supervisés

Autres méthodes de classification probabilite directe

Classification par K-Premiers Voisins.

Arbres de Décision

Classification probabiliste indirecte

Estimation de densité par K-Premiers Voisins.

Estimation de densité par estimateur à noyau.
 

Estimer les performances d'un classifieur

Au delà de la resubstitution

Classes normales : les différents critères d'erreur

Méthodes de ré-échantillonage

Validation simple et validation multiple.

Validation croisée et "Leave One Out".

Bootstrap

Choisir les variables d'un classifieur

Pourquoi limiter le nombre de variables ?

Méthodes pas à pas

Ascendante avec ou sans remise en cause.

Descendante.

Mixte.