Christophe Genolini a écrit :Faire comprendre a un mahala-novice (moi) ce qu'est la mahala-distance ;-)
J'essaye de comprendre aussi, jusqu'ici j'avais jamais cherché à comprendre. Pour le cas diagonal on est ok.
Allons-y pas-à-pas... considérons que la réponse d'un individu est bivariée: une note en maths et une note en physique, et considérons que le prof de maths et celui de physique donnent des notes qui se distribuent selon la même loi, disons 10 de moyenne, et la même variance.
Quant à l'association entre les 2 notes, considérons 2 cas: 1) les notes de maths et physique sont indépendantes 2) les notes de maths et physique sont très corrélées. Dans chaque cas on utilise la distance de Mahanalobis avec une matrice associée aux hypothèses de cas (donc diagonale dans le 1er cas, et avec les mêmes coefficients diagonaux car on suppose les mêmes variances).
Disons que l'individu x1 qui a (10,10) est "l'individu moyen" (quelle horreur!). Considérons deux indivdus x2=(10,15) et x3=(13,14).
- Dans le cas 1), il y a la même distance entre x1 et x2 qu'entre x1 et x3 (on peut voir que x2 et x3 sont sur le même cercle de centre x1).
- Dans le cas 2), ces distances ne seront pas les mêmes. Je pense que (je n'ai pas vérifié) si la variance est assez large, et la corrélation assez forte, l'individu x3 sera plus proche de l'individu moyen x1 que l'individu x2. L'individu x2 a des notes dispersées et donc s'éloigne de la "norme".
À savoir que géométriquement parlant, dans le cas 2), les individus à une même distance de l'individu moyen se situent sur une ellipse.
On comprend ainsi assez bien la distance de Mahanalobis entre un individu et "l'individu moyen", mais ça me semble plus difficile d'interpréter la distance entre 2 individus quelconques. Géométriquement on doit peut-être pouvoir la visualiser avec une feuille de papier millimétré déformée, en sorte que les cercles se tranforment en les ellipses associées à la matrice.