FORMATION "PREDICTION en Data Mining"

 

 

* Quel budget cette famille va-t-elle consacrer à ses vacances ?

* Combien de temps ce conducteur va-t-il conserver sa voiture ?

* Quel est le montant d'un salaire "juste" pour ce poste ?

* Quel sera le CA de ce nouveau magasin ?
 

Autant de questions, et bien d'autres, qui demandent de prédire la valeur d'un nombre dans une situation donnée.

Y répondre, c'est faire de la régression. De nombreuses techniques permettent d'aborder ce genre de problème. Cette formation de 1 ou 2 journées (voir contenu ci-dessous) a pour objet d'apprendre à sélectionner la technique appropriée et la mettre en œuvre dans des conditions satisfaisantes

 

 Plan de la formation

Le problème général de la régression

Notion de probabilité conditionnelle, fonction de régression

Hypothèses sur la dispersion des données, fonction d'erreur

 

La Régression Linéaire

La droite des Moindres Carrés

Variance des résidus, R²

Hypothèses et limitations

Linéarité

Normalité

Homoscédasticité

La Régression Linéaire Multiple

Le modèle linéaire multiple

Corrélations et colinéarité

Comment choisir les variables explicatives ?

Importance du choix des variables.

Méthodes ascendante, descendante, mixte.

Comment interpréter le coefficient de corrélation R

Analyse des résidus

Hypothèses et limitations

Linéarité et normalité.

Corrélation et causalité.

Multicolinéarité, matrices mal conditionnées.

La régression PLS

La régression non linéaire

Modèles paramétriques

Détermination des paramètres par maximum de vraisemblance

Les Réseaux de neurones supervisés

Approximation universelle et régression

Les principaux types de Réseaux de neurones supervisés

Le Perceptron Multicouches

Les Réseaux RBF