Propriete des distances utilisees avec Ward?

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Varin Thibault
Messages : 31
Enregistré le : 08 Nov 2006, 11:23

Propriete des distances utilisees avec Ward?

Messagepar Varin Thibault » 24 Sep 2008, 10:35

Bonjour, je dois utiliser la methode de clustering hierarchique ward avec differentes distances. Il y a de nombreuses fonctions de distance disponibles dans R mais je n arrive pas a savoir lesquels on peut utiliser. Est-ce que quelqu un sait qu'elles proprietes les distances utilisees doivent verifier?
Doivent elles repondre a la definition d une distance euclidienne ou simplement d une metrique?
Merci d avance
Cordialement
Varin Thibault

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 24 Sep 2008, 10:59

Bonjour,

La distance que tu utilises et l'algorithme de classification sont deux choses indépendantes. L'algorithme de classification spécifie juste la manière dont sont regroupé les individus à partir des distances. Il ne me semble pas qu'il y est des prérequis avant l'utilisation d'un algorithme plutôt qu'un autre, seul va changer la méthode et les critères pris en compte pour agréger les entités entre elles.

Tu devrais pouvoir trouver pas mal de document sur les algo de classification sur le net et dans les nombreux bouquins traitant du sujet.

Maxime

[Edit]: Un lien vers un pdf qui a l'air très bien fait : http://www.imep-cnrs.com/mroux/algoclas.pdf

Varin Thibault
Messages : 31
Enregistré le : 08 Nov 2006, 11:23

Messagepar Varin Thibault » 24 Sep 2008, 13:53

Rebonjour, merci pour cette reponse rapide et le lien qui est tres interessant.
Je confirme le fait qu'il est necessaire avec Ward (ce qui ne semble pas etre le cas avec les methodes dites a lien simple et complet par exemple) d'utiliser une matrice de distance symetrique et definie positive. A priori la propriete euclidienne n'est pas necessaire. Il ne me reste plus qu'a :
1. Trouver une methode pour tester la symetrie d'une matrice de distance
2. Trouver une methode permettant de transformer une matrice de distance non symetrique en une matrice de distance symetrique (j ai vu que ce type d approche pouvait etre utilise pour transformer une matrice de distance non euclidienne en une euclidienne (fonctions lingoes et cailliez dans le package ade4 par exemple).
Pour ceux que ca interesse voici ma source :
http://lisa.ulb.ac.be/images/STATH400-Clustering.pdf
Merci encore!!!
Varin Thibault

François Bonnot
Messages : 537
Enregistré le : 10 Nov 2004, 15:19
Contact :

Messagepar François Bonnot » 25 Sep 2008, 06:01

1. Trouver une methode pour tester la symetrie d'une matrice de distance

Bonjour,
Il existe une fonction isSymmetric() pour faire ce test.

FB

Varin Thibault
Messages : 31
Enregistré le : 08 Nov 2006, 11:23

Messagepar Varin Thibault » 25 Sep 2008, 13:20

Merci pour toutes les reponses!
A priori isSymmetric ne peut pas effectuer le test directement sur un objet distance. Mais la fonction metrify (package labdsv) transforme une matrice de distance "non metrique" en une verifiant ces proprietes. Donc a priori si la matrice n est pas transforme, c'est bien qu elle verifiait ces proprietes...
Merci encore!
Thibault


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité