Bonjour,
j'ai un gros doute sur la formule utilisee pour calculer la distance de canberra sous R.
La formule retrouvee sur internet est celle-ci :
d(x,y) = sum(abs(x-y)/(x+y))
On peut utiliser entre autres (recherche non exhaustive) les fonctions dist() de stats, Dist() d'amap, gdist() de mvpart ou vegdist() de vegan.
Les 2 premieres disent utiliser la formule classique mais je suppose qu'elles utilisent plutot au vu des petits calculs realises :
d(x,y) = (NZ + 1)/NZ * sum(abs(x-y)/(x+y))
avec NZ = nb de paires de coordonnees differentes de (0,0) (Non Zeros)
les 2 dernieres fonctions utilisent la formule (affichee dans l'aide, c'est en tout cas comparable pour des variables positives) comme on peut la retrouver sur DMAUtil (dans la doc d'ADE4 version logiciel) :
d(x,y) = 1/NZ * sum(abs(x-y)/(x+y))
Si quelqu'un peut m'aider a comprendre tout cela et a voir en quoi cela ne gene pas les analyses.
Merci d'avance,
Fred
PS : faites attention a la sortie de la fonction dudi.pca ; "norm" ne vous donne pas tout le temps ce qui est ecrit dans la description. "norm" vous donne le vecteur des ecarts-types des variables de depart quand vous etes en ACP normee et le vecteur des ecarts-types des variables normees quand l'ACP n'est pas normee !!! Nous avons fait la remarque aux concepteurs mais sans grand succes.