acm

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 14 Aoû 2007, 10:21

mais je dois réaliser le kmean sur les colonnes puis sur les lignes ou tout en même temps ?

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 14 Aoû 2007, 13:04

les lignes représentent les lignes du tableau de départ. Donc ici ce sont les coordonnées des individus dans le plan factoriel. Donc si vous souhaiter faire une classification des individus il faut donc prendre les lignes pour le kmeans.

Tillard
Messages : 87
Enregistré le : 17 Déc 2004, 10:32

Messagepar Tillard » 14 Aoû 2007, 13:06

pour le choix du nombre d'axes de l'acm: regardez les valeurs propres

si vous voulez une typologie des lignes, faire la classif (k-means) sur $li


cela dit, êtes vous sur ne ne pas pouvoir effectuer une classif ascendante hierarchique sur votre jeu de données (40000 lignes) ?

essayer pour voir combien de temps ca prend

Code : Tout sélectionner

hclust(dist(dudi.acm$li), method="ward")


cordialement
Emmanuel Tillard
UMR ERRC (Elevage des Ruminants en Regions Chaudes)
CIRAD - St PIERRE (La Réunion)
tel: 02 62 49 92 54

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 14 Aoû 2007, 13:45

Ok pour les lignes c'est ce que j'ai fait...

Mais question surement idiote...sur quel critère sont faits les cluster. K means minimise la somme des carrés pour chaque cluster si j'ai bien compris, mais comment savoir par quelles modalités de départ ces individus ont ils été regroupés...? (je doute d'avoir été clair)


Quant à la classif ascendante hierarchique j'ai un problème de mémoire... J'ai en effet désormais près de 60 000 lignes, ca ne semble pas vouloir passer; mais si c'est une question de ressource PC je peux le tenter sur un autre...

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 14 Aoû 2007, 13:52

Et oui aussi (merci à tous de me répondre bien sur!!) que dois-je regarder avec les valeurs propres? Parce que problème ( je pense) ma première vp est égale à 1...!!

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 14 Aoû 2007, 17:38

Mais question surement idiote...sur quel critère sont faits les cluster. K means minimise la somme des carrés pour chaque cluster si j'ai bien compris, mais comment savoir par quelles modalités de départ ces individus ont ils été regroupés...?


là dessus aucune idée...ça commence mal...:D

que dois-je regarder avec les valeurs propres?

La première valeur propre est toujours la plus forte (c'est ordonné comme ça :p) ensuite il y a un premier "saut" vers la seconde valeur et ensuite on s'arrête à la valeur propre précédent le seond "saut". J'entend par saut une chute plus ou moins brutale de l'inertie entre chaque saut l'inertie diminue progressivement (les barres de l'histogramme forment une courbe régulière)

Parce que problème ( je pense) ma première vp est égale à 1...!!

non ce n'est pas un problème.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 15 Aoû 2007, 03:42

Couanais Pierre a écrit :ah ok très bien merci...

Je pense que 3 axes peuvent suffire non?

Je tente donc le kmeans sur tout ceci...


Dans une acm avec bcp de variables, la variance est souvent très "diluée" et il faut alors probablement garder bcp plus que 3 axes factoriels.

Renaud

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 16 Aoû 2007, 08:22

Ok Nicolas, tant mieux pour la vp=1 si ca ne pose pas de pb et c'est compris pour l'inertie. Donc merci


Pour les axes factoriels je en sais pas trop combien en prendre, je vasi tater... y a t-il un parametre qui indique l'inertie expliquée par chaque axe? Ca faciliterait la chose

Merci à tous en tout cas

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 16 Aoû 2007, 08:27

Bonjour,

Oui pour chaque axe il suffit de diviser la valeur propre par la somme des valeurs propres et ça te donne l'inertie expliqué par l'axe :

Code : Tout sélectionner

library(ade4)
data(banque)
banque.acm <- dudi.acm(banque,scannf=F,nf=20)
banque.acm$eig/sum(banque.acm$eig)*100
# voir aussi du côté de inertia.dudi


Maxime

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 16 Aoû 2007, 09:04

Ok merci Maxime. Dans mon cas j'ai 22 vp et à part la premièe qui explique presque 20% de l'inertie, les suivantes en expliquent pas plus de 5%.... :roll:


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité