Classification avec kmeans

Questions sur les fonctions statistiques de R

Modérateur : Groupe des modérateurs

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Classification avec kmeans

Messagepar Sébastien Hamel » 09 Aoû 2006, 08:37

Est-ce qu'il existe un moyen pour "fixer" les couleurs des classes pour kmeans.
Car si je veux comparer différents résultats obtenus avec kmeans, les couleurs varient à chaque fois & cela est assez pénible voir impossible d'analyser correctement.
Alors existe-t-il un moyen pour fixer la couleur des classes créer avec kmeans quand on affiche un résultat avec l'option image.plot?

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Messagepar Sébastien Hamel » 09 Aoû 2006, 11:52

Car en fait, quand on réalise plusieurs fois à la suite une classification avec kmeans sur un meme jeu de données, la classification change.
Je veux dire par la que le numéro des classes varie d'une classification à une autre & si l'on travaille sur un meme jeu de données en faisant varier un paramètre, l'affichage avec image.plot de la classification sera difficilement comparable étant donnée que la couleur change.....
Par exemple, la classe 1 pour le kmeans 1 = bleu
alors que la classe 1 pour le kmeans 2 = rouge alors que ce sont les memes donnees à la base.
Est-ce que je me fais comprendre?

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Messagepar Sébastien Hamel » 09 Aoû 2006, 11:53

Ce n'est donc pas la couleur qu'il faudrait pouvoir fixer mais la classification en elle même puisque d'une classification à une autre l'ordre des classes varie!!

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Messagepar Sébastien Hamel » 09 Aoû 2006, 14:16

enfin bref, passons.
J'aimerais savoir pourquoi est-ce qu'il n'est pas possible d'avoir des valeurs de type NA dans une matrice pour faire mon kmeans?

Ca ne marche pas en tout cas!...

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Messagepar Sébastien Hamel » 09 Aoû 2006, 14:30

l'aide dit que kmeans(x,....) doit avoir des colonnes entièrement numérique
je comprends alors pourquoi avec des valeurs NA ca ne marche pas puisque mode(NA)='logical'
or si je remplace toutes mes valeurs NA par NaN puisque mode(NaN)='numeric' ca ne marche toujours pas.
J'ai absolument besoin d'avoir des NA ou des NaN dans ma matrice! QQ'un connaitrait-il un autre moins ?
Why ca ne marche tjs pas?
C'est triste...

Samir Messad
Messages : 75
Enregistré le : 10 Jan 2005, 20:56

Messagepar Samir Messad » 09 Aoû 2006, 15:42

because, la méthode de partitionnement kmeans ne prend naturellement pas en compte les valeurs manquantes. il faut comme d'autres méthodes d'analyses multivariées fournir une matrice sans données manquantes.

Attention vous faites une petite confusion dans l'utilisation de NA et NaN. Le premier est une constante (logique) qui peut s'insérer dans un vecteur de type quelconque pour préciser l'existence d'une valeur manquante. Le second est le résultat d'un calcul indiquant que ce dernier n'est ni un nombre réel, ni un entier.


Cordialement;

Samir Messad

Vincent Andres
Messages : 13
Enregistré le : 17 Juil 2006, 09:27

Messagepar Vincent Andres » 09 Aoû 2006, 16:01

Sébastien Hamel a écrit :... or si je remplace toutes mes valeurs NA par NaN puisque mode(NaN)='numeric' ca ne marche toujours pas.
J'ai absolument besoin d'avoir des NA ou des NaN dans ma matrice! QQ'un connaitrait-il un autre moins ?

Vous n'avez pas une valeur numérique disponible, qui pourrait être réservée et utilisée pour remplacer vos NAs ?

Sébastien Hamel
Messages : 71
Enregistré le : 11 Mai 2006, 08:00

Messagepar Sébastien Hamel » 10 Aoû 2006, 06:45

Vincent Andres a écrit :Vous n'avez pas une valeur numérique disponible, qui pourrait être réservée et utilisée pour remplacer vos NAs ?

Le pb est que si je remplace par une valeur numérique telle 0, ca va biaisée ma classification, non?

Vincent Andres
Messages : 13
Enregistré le : 17 Juil 2006, 09:27

Messagepar Vincent Andres » 10 Aoû 2006, 12:56

Sébastien Hamel a écrit :Le pb est que si je remplace par une valeur numérique telle 0, ca va biaisée ma classification, non?

A moins d'être devin, sans plus d'infos sur le problème, je vois vraiment mal comment on pourrait répondre !
M'enfin, déjà, un essai juste pour voir ne ferait sans doute pas de mal.

Coralie Borreil
Messages : 21
Enregistré le : 25 Mar 2009, 15:02

Problème de NA

Messagepar Coralie Borreil » 02 Aoû 2010, 14:01

Bonjour

J'ai un tableau de données de 16 colonnes et de plus de mille lignes. Ayant des NA dans mon tableau, car toutes les colonnes ne sont pas renseignées pour chaque ligne, j'ai rentré la formule suivante

norm<-read.table("Homoscedasticite.txt",h=T,sep="\t", na.strings="NA")

Seulement, lorsque je vérifie mon tableau à l'aide de la fonction edit je me rend compte que dans certaines colonnes les NA ont disparus alors que dans les autres non, comment cela se fait-il? Y a-t-il un moyen pour contourner ce problème?

Je ne peux malheureusement pas changer les NA en chiffre car mon tableau couvre toutes les valeurs de 0 à 100 et que si je rajoute un autre chiffre cela me biaisera mes moyennes, etc...

Merci d'avance pour l'aide

Coralie

Serge Rapenne
Messages : 1205
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Messagepar Serge Rapenne » 02 Aoû 2010, 15:46

Bonjour,

Il aurait été préférable d'ouvrir un nouveau sujet plutôt que de poursuivre un sujet sans rapport avec ta question.
D'autre part que veux tu dire par "les NA ont disparu" qu'y a t'il à la place ?

Serge

Coralie Borreil
Messages : 21
Enregistré le : 25 Mar 2009, 15:02

Messagepar Coralie Borreil » 02 Aoû 2010, 15:49

Désolée

Je ne me suis rendu compte qu'après que je n'avais pas posté le message au bon endroit...

Il me mettait des "blancs" à la place des NA

Serge Rapenne
Messages : 1205
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Messagepar Serge Rapenne » 02 Aoû 2010, 15:59

A priori, si R met des blancs c'est qu'il considère que la colonne est une colonne de texte et non de chiffres.
Es tu sur que tes NA ne contiennent pas d'espace qui tromperais R. si tu as des lignes du type 2\t NA\t5 à la place de 2\tNA\t5, ou alors présence de 2 \t consécutifs. Dans ces 2 cas R va avoir des pbs (c'est pour ça que je préfère utiliser le ";" comme séparateur )


Serge


Retourner vers « Archives : Fonctions statistiques »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité