Méthode de classification en fonction de courbes d'évolution

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Christel Anger
Messages : 50
Enregistré le : 12 Mar 2008, 13:57

Méthode de classification en fonction de courbes d'évolution

Messagepar Christel Anger » 23 Mai 2008, 11:44

Bonjour,

Mes données correspondent à des effectifs par commune et par année.
Je souhaiterai les classer en fonction du type d'évolution c'est-à-dire en fonction de la forme de la courbe des effectifs au cours du temps.

Pour cela, je transforme dans un premier mes valeurs d'effectifs en "taux d'évolution" c'est-à-dire (avec n=année)

effectif n -> (effectif n - effectif n-1) / effectif n-1

(précisons que c'est uniquement l'évolution et non les valeurs qui m'intéressent pour l'instant d'où cette transformation)

Mes données étant très importantes, j'utilise ensuite pour faire ma classification la fonction clara().

Mon script tourne mais les groupes obtenus ne correspondent à ce que je veux puisqu'en vérifiant quelques communes, je m'aperçoit que les "formes de courbes d'évolution" ne correspondent pas au sein d'un même groupe...

Quelqu'un a-t-il déjà réaliser ce genre de classification et aurait-il des suggestions pour résoudre mon problème?

D'avance merci.

Christel

romain legrand
Messages : 13
Enregistré le : 25 Avr 2008, 09:19

Messagepar romain legrand » 23 Mai 2008, 12:11

Salut, je ne connais pas cette fonction, mais si tu as beaucoup de données tu peux également utiliser les kmeans.
tu peux aussi tester différentes distances (euclidienne, manhattan ...) pour voir celle qui s'adapte le mieux à tes données.

Christel Anger
Messages : 50
Enregistré le : 12 Mar 2008, 13:57

Messagepar Christel Anger » 23 Mai 2008, 15:10

Merci pour ta réponse, je ne savais pas que kmeans pouvait tourner avec autant de données mais effectivement ça marche! Malheureusement ça ne donne toujours pas le résultat espéré même en modifiant la métric et même la méthode...

En revanche, après reflexion je me dis que ça pourrai peut être s'améliorer si j'arrivai à "dire" à la fonction de classification que les données des dernières années ont plus de poid que les autres... en effet, la plupart de mes lignes ont des effectifs qui augmentent les premières années mais qui ensuite évolue différemment : augmentation continu, plateau ou régression après augmentation... (désolé si ce n'est pas clair, je n'arrive pas à insérer d'image...).

Est-il possible d'ajouter cette condition à la classification?

Merci

Christel[/img]

Christophe Genolini
Messages : 698
Enregistré le : 12 Juin 2006, 21:37
Contact :

Messagepar Christophe Genolini » 23 Mai 2008, 15:15

Si je comprends ta démarche, tu travailles plutôt sur des trajectoires, c'est a dire les effectifs année après année.

Si c'est bien le cas, il te faut faire de l'analyse de trajectoire : Proc Traj sous SAS, mmlcr sous R (hélas assez mal documenté)

Christel Anger
Messages : 50
Enregistré le : 12 Mar 2008, 13:57

Messagepar Christel Anger » 02 Juin 2008, 07:50

Bonjour,

Merci Christophe, effectivement, la fonction mmlcr() à l'air bien adaptée à mon étude, mais j'ai quelques soucis pour extraire la répartition par classe (j'ai fait un nouveau post sur cette question sur le forum)

Christel


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité