FORMATION "CLASSIFICATION"
|
|
|||
* Faut-il accorder le prêt que demande cet emprunteur ?
* Quel modèle ce client va-t-il acheter ?
* Ce client a-t-il un potentiel à long terme ?
* Quels sont ceux de mes clients qui risquent de me quitter ?
Autant de questions, et bien d'autres encore, qui demandent
d'affecter un individu à une catégorie (ou "classe"), si possible
avec une probabilité, et si possible en identifiant ceux des attributs de l'individu
les plus pertinents. Le Data Mining offre une large panoplie de méthodes de
classification
(voir ci-dessous le contenu de la formation).
Le succès de leur mise en œuvre dépend pour une large part de la connaissance
qu'a le praticien de leurs mécanismes.
Plan de la formation
Le problème général de la classification (supervisée)
L'approche géométrique
Frontière, fonctions discriminantes.
L'approche probabiliste
Théorème de Bayes et décision bayésienne.
Classifications probabilistes directe et indirecte.
L'Analyse factorielle discriminante
Exemple à deux classes : le critère de Fisher
Généralisation : notion d'axe discriminant
Projections discriminantes
Lien avec l'ACP
Construire un classifieur géométrique
Classement par distance aux centres
Classes normales
Changement de métrique : distance de Mahalanobis
Lois d'affectation linéaires et quadratiques
Estimation du taux de mauvaise classification
Construire un classifieur probabiliste
Classification probabiliste directe par régression sur indicatrices
Régression Linéaire Multiple sur indicatrices.
La Régression Logistique.
Les Réseaux de neurones supervisés
Autres méthodes de classification probabilite directe
Classification par K-Premiers Voisins.
Arbres de Décision
Classification probabiliste indirecte
Estimation de densité par K-Premiers Voisins.
Estimation de densité par estimateur à noyau.
Estimer les performances d'un classifieur
Au delà de la resubstitution
Classes normales : les différents critères d'erreur
Méthodes de ré-échantillonage
Validation simple et validation multiple.
Validation croisée et "Leave One Out".
Bootstrap
Choisir les variables d'un classifieur
Pourquoi limiter le nombre de variables ?
Méthodes pas à pas
Ascendante avec ou sans remise en cause.
Descendante.
Mixte.