Bonjour,
Juste pour signaler que l'on pense avoir détecté une erreur dans la fonction "dissimilarity" du package "arules" en ce qui concerne le calcul de l'indice de similarité de Dice.
En théorie, elle retourne la valeur 2 * a / (2*a + b + c) pour cet indice mais dans le code source, il est calculé de la manière suivante :
d = (2 * a / (2*a_b_c)) avec a_b_c = a+b+c
Il est donc égal ici à l'indice de Jaccard qui est de la forme a/(a + b + c), alors qu'il est sensé doubler le poids du nombre de couples 1-1 (a) .
Nous avons vérifié sur des exemples simples et comparé les résultats à ceux de la fonction dist.binary du package "ade4".
Si nous n'avons pas fait d'erreur, savez vous comment il est possible de modifier la fonction?
Merci.
Caroline Domerg et Frédéric Chiroleu
UMR 53 PVBMT (Peuplements Végétaux et Bio-agresseurs en Milieu Tropical)
CIRAD
Pôle de Protection des Plantes (3P) - Saint-Pierre
Île de la Réunion