Le "barycentre" d'un ensemble de points est simplement son centre de gravité. Les points peuvent porter chacun un poids, et ces poids peuvent être différents (voir p. ex. Analyse des Correspondances).
L'illustration ci-dessous illustre le concept de "barycentre".
Pour la voir, vous devez avoir FlashPlayer sur votre ordinateur. Si vous ne
l'avez pas, vous pouvez le télécharger gratuitement à www.macromedia.com/downloads/
.
* Déplacez les points avec votre souris.
* Pour modifier le poids d'un point, cliquez sur ce point, changez le poids, puis validez en cliquant à nouveau sur le point ou en le déplaçant.
Remarquez la grande influence des points "lourds" sur la position et les mouvements du barycentre.
La propriété fondamentale du barycentre est la suivante : le barycentre des projections des points sur l'axe x1 est identique à la projection du barycentre sur cet axe. Il en est de même sur x2 , ainsi que sur n'importe quelle autre droite. En termes lapidaires, le barycentre des projections est la projection du barycentre. Ceci est une conséquence directe de la nature linéaire de la formule définissant les coordonnées du barycentre :
|
b1 = |
où :
* b1 est la coordonnée du barycentre sur l'axe 1,
* wi est le poids porté par le point n° i,
* xi1 est la coordonnée du point n° i sur l'axe 1,
et une formule similaire pour l'axe 2.
En d'autres termes, les coordonnées du barycentre sont les moyennes pondérées des coordonnées des points.
Voir aussi Inertie;
Ce terme a au moins quatre significations différentes en modélisation. On parle en effet de :
Dans tous les cas, le le mot "biais" désigne un écart systématique d'une grandeur par rapport à une grandeur de référence.
_______________________________________________
Des données sont dites biaisées si elles ont été collectées dans des conditions qui s'écartent sensiblement des conditions normales. Un exemple simple de biais se rencontre couramment lorsqu'on mesure une grandeur physique. Ainsi, si une balance n'a pas été correctement réglée, et qu'elle indique un poids de 10g quand le plateau est vide, toutes les mesures effectuées avec cette balance produiront des nombres excédant de 10 (grammes) les poids réels des objets pesés. Ceci peut ne pas être très grave tant qu'on se sert toujours de la même balance, mais des incohérences apparaîtront lorsqu'on comparera les mesures faites avec cette balance et celles effectuées avec une autre balance, celle-la correctement règlée.
Le biais des données est un défaut extrêment fréquent et
est souvent difficile à détecter en raison de la multiplicité des causes possibles
de biais. Par exemple, les données commerciales des différentes agences d'une
banque peuvent-elles être biaisées :
*
Par le contexte démographique et social des agences.
*
Par la plus ou moins grande proximité d'agences concurrentes.
* Par les anciennetés respectives des agences.
* Par
le "climat financier ambiant" à l'époque de la collecte des données.
ainsi que par de multiples autres causes possibles, parfois liées à des procédures de collectes elles-mêmes.
Les biais des données est évidemment néfaste à l'élaboration de modèles fiables, et doit être corrigé, ou pour le moins détecté avec énergie avec des techniques appropriées. Il a pour effet de donner de la réalité une image fausse, qui, si ce défaut n'est pas détecté à temps, donnera des interprétations fausses de nouvelles données non biaisées. Réciproquement, un modèle construit sur des données saines conduira à des interprétations fausses de nouvelles données si celles-ci sont biasées.
Cependant, si le biais des données reflète une réalité (c'est à dire, n'est pas dû à des raisons méthodologiques), le Data Mining peut le débusquer et aider à son interprétation. La figure ci-dessous illustre le cas de deux agences bancaires exhibant des comportements différents de leurs clients respectifs. Construire un modèle sur les clients de l'agence A, puis utiliser celui-ci à des fins prédictives sur les clients de l'agence B conduira à des résultats erronés. Mais réciproquement, le Data Mining peut mettre en lumière, et aider à l'interprétation de cette différence de comportement.
2) Biais d'un estimateur
Voir ici.
Voir
ici.
4) Biais d'un neurone (d'un Perceptron Multicouches)
Parmi les paramètres (poids) d'un neurone standard d'un PMC, il exite un poids ayant un rôle particulier, et qui s'appelle "biais", ou "seuil".
Binaire (Variable)
Une variable est dite binaire si elle ne peut prendre que deux valeurs, souvent codées par "0" et par "1".
Des exemples typiques de variables binaires sont :
Une variable binaire est donc un cas particulier (le plus simple) de variable nominale. Mais une variable binaire peut également être considérée comme un cas particulier de variable numérique : c'est souvent cette interprétation qui est utilisée dans les présentations de la Régression Logistique.
Voir aussi : Variable, Numérique, Nominale, Ordinale.
____________________________________________________________