FORMATION "CLASSIFICATION NON SUPERVISEE"

 

  Dans votre base de données, les individus sont-ils à peu près uniformément répartis dans l' "espace" défini par leurs attributs ? Ou bien au contraire tendent ils à se rassembler en un petit nombre de  groupes (ou "classes") compacts et bien différenciés ?

Vraisemblablement, vous ne le savez pas, et pourtant cette information serait très utile. Elle permettrait en particulier de cibler vos actions promotionnelles vers tel ou tel groupe, évitant ainsi une dispersion de vos efforts dans des directions peut-être stériles.

C'est à ce genre de problème que répond la Classification Non Supervisée (ou "Classification automatique", ou "Clustering").

 

 

Plan de la formation

Principes généraux de la segmentation

L'exemple à deux dimensions

Similarité et distance entre individus

Différentiation entre classes

Choix d'un critère de qualité

Combien de classes ?

La Classification Ascendante Hiérarchique (CAH)

Principe d'agrégation

Dendogramme

Les choix à assumer

Distance entre individus

Distance entre classes

Critères d'agrégation

Avantages et inconvénients de la CAH

Choix a posteriori du nombre de classes

Influence des choix de paramètres

Robustesse

Individus supplémentaires

Temps de calcul

Les k-moyennes

Principe des centres mobiles

"Prototypes", "parangons", et barycentres

Pourquoi il y a plusieurs solutions

Avantages et inconvénients des k-moyennes

Choix a priori du nombre de classes

Temps de calcul

Individus supplémentaires

Problèmes liés à l'initialisation

Les Cartes de Kohonen

Principe des Cartes de Kohonen

Architecture

Algorithme de Kohonen

Cartes de Kohonen et segmentation

Neurones et micro-classes

Des micro- aux macro-classes

Notion de proximité entre segments

Typologie et qualité d'apprentissage
 

Les Arbres de Segmentation

Principe des Arbres de Segmentation

Pouvoir discriminant d'une variable.

Décomposition récursive d'une base de données.

Différentes techniques de branchement

CHAID (Chi_Deux)

Entropie (C5)

Critère de Gini (C&RT)

Variables nominales et variables numériques
 

La segmentation floue

Pourquoi la segmentation floue ?

Un individu appartient à plusieurs classes

Algorithme de segmentation floue 

Interprétation d'une segmentation floue