FORMATION "CLASSIFICATION NON SUPERVISEE"
|
|
|
Dans votre base de données, les individus sont-ils à
peu près uniformément répartis dans l' "espace" défini par leurs attributs
? Ou bien au contraire tendent ils à se rassembler en un petit nombre de groupes
(ou "classes") compacts et bien différenciés ?
Vraisemblablement,
vous ne le savez pas, et pourtant cette information serait très utile. Elle
permettrait en particulier de cibler vos actions promotionnelles vers tel ou
tel groupe, évitant ainsi une dispersion de vos efforts dans des directions
peut-être stériles.
C'est à ce genre de problème que répond la Classification Non Supervisée (ou "Classification automatique", ou "Clustering").
Plan de la formation
Principes généraux de la segmentation
L'exemple à deux dimensions
Similarité et distance entre individus
Différentiation entre classes
Choix d'un critère de qualité
Combien de classes ?
La Classification Ascendante Hiérarchique (CAH)
Principe d'agrégation
Dendogramme
Les choix à assumer
Distance entre individus
Distance entre classes
Critères d'agrégation
Avantages et inconvénients de la CAH
Choix a posteriori du nombre de classes
Influence des choix de paramètres
Robustesse
Individus supplémentaires
Temps de calcul
Les k-moyennes
Principe des centres mobiles
"Prototypes", "parangons", et barycentres
Pourquoi il y a plusieurs solutions
Avantages et inconvénients des k-moyennes
Choix a priori du nombre de classes
Temps de calcul
Individus supplémentaires
Problèmes liés à l'initialisation
Les Cartes de Kohonen
Principe des Cartes de Kohonen
Architecture
Algorithme de Kohonen
Cartes de Kohonen et segmentation
Neurones et micro-classes
Des micro- aux macro-classes
Notion de proximité entre segments
Typologie et qualité d'apprentissage
Les Arbres de Segmentation
Principe des Arbres de Segmentation
Pouvoir discriminant d'une variable.
Décomposition récursive d'une base de données.
Différentes techniques de branchement
CHAID (Chi_Deux)
Entropie (C5)
Critère de Gini (C&RT)
Variables nominales et variables numériques
La segmentation floue
Pourquoi la segmentation floue ?
Un individu appartient à plusieurs classes
Algorithme de segmentation floue
Interprétation d'une segmentation floue