Probleme hist

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Fabien Papeil
Messages : 6
Enregistré le : 16 Avr 2007, 12:18

Probleme hist

Messagepar Fabien Papeil » 21 Mai 2007, 14:13

Bonjour,
Tout d'abord je dois dire que je suis ravi de participer à un tel forum !
Je dois également avouer que R n'est pas franchement un logiciel que je maitrise totalement meme si je sais exploité certaines choses dessus

je dispose d'un fichier assez conséquent avec des informations sur des versements effectué par des personnes envers mon organisme ou de mon organisme envers ces personnes.
Je dispose d'ailleurs d'une colone qui fait un ratio de ces deux valeurs(donc avec des valeurs avec des nombreuses décimales et des valeurs manquantes codés NA).

Mon probleme est que je n'arraive pas à faire d'histogramme avec aucune des trois valeurs. J'ai des messages d'erreurs. Quelqu'un aurait t'il une idée de la maniere dont je dois m'y prendre ?

Merci d'avance :oops:
Fabien

Thomas Galtier
Messages : 93
Enregistré le : 14 Mai 2007, 12:08

Messagepar Thomas Galtier » 21 Mai 2007, 14:26

Salut,

Post ton code ici avec le message d'erreur ... peut-etre que ça pourra eclairer du monde. Personnellement je suis pas expert meme novice donc je peux pas trop t'aider mais chez moi la commande hist(données) marche bien.

Thomas

Logez Maxime
Messages : 2897
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 21 Mai 2007, 14:26

Bonjour,

Pourrais tu nous donner un exemple des messages d'erreurs que tu rencontres et du code dont tu te sers pour faire afficher tes histogrammes.

Maxime

Fabien Papeil
Messages : 6
Enregistré le : 16 Avr 2007, 12:18

Messagepar Fabien Papeil » 21 Mai 2007, 19:18

Je vous mettrai ca demain, la jsuis chez moi j'ai pas mon fichier donc c'est pas facile.
Je me rapelle plus trop ca me disais que x devait etre numérique alors que a part les na géré des limportation dans R il n y a que des nombres pas de chaines de caracteres ni rien
Fabien

Logez Maxime
Messages : 2897
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 21 Mai 2007, 19:32

Re,

Une des premières choses que tu peux faire est un summary de ton tableau que tu importes dans R afin d'être sur que les valeurs dans celui-vi sont bien des nombres et non pas des facteurs parceque pour une valeur une virgule s'est glissé à la place d'un point ou ce genre de petits détails qui peuvent transformer une colonne de nombre en facteur dans R une fois importé.

Maxime

Fabien Papeil
Messages : 6
Enregistré le : 16 Avr 2007, 12:18

Messagepar Fabien Papeil » 21 Mai 2007, 19:58

C'est un fichier csv obtenu grace à une feuille excel, la colonne est bien composé de nombre je pense. Si ce n'est pas le cas comment pourrais je les changer?
Fabien

Logez Maxime
Messages : 2897
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 21 Mai 2007, 20:56

Re,

Je serai toi avant d'envisager quoi que ce soit je commencerai par vérifier le tableau, c'est plus simple que de se perdre en conjoncture. Pour cela vérifie au préalable le tableau que tu as importé et puis envoie qq lignes de ton tableau ainsi que le code que tu utilises.

Maxime

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 22 Mai 2007, 05:28

ouvre ton fichier csv dans excel, fait un copié collé mais uniquement des valeurs. donne un format nommbre à 2 décimale par exemple à tes cellules, au passage vérifie bien que ton séparateur décimal est le point et ensuite enregistre le en txt et normalement tu auras un tableau tout propre :)

Fabien Papeil
Messages : 6
Enregistré le : 16 Avr 2007, 12:18

Messagepar Fabien Papeil » 22 Mai 2007, 07:39

Bonjour,

C'était bien un probleme de décimale, c'est réglé cependant j'aurais une autre petite question:
Dans une des colonnes que j'ai étudié les donnée sont des ratios, presque tous proche les uns des autres comment pourrais je faire afin d'isoler les quelques variables qui ruinent mon graphique en lui mettant une echelle illisible pour l'information que je voudrais mettre en avant
Est ce que l'option include lowest peut etre utile?:?:
PS: mes valeurs sont surtout situé autour de 0.5 et 2.5 et j'en ai une nottament qui est égale a 65
Voici le code tres basique que j'ai fait :P

Code : Tout sélectionner

hist(PC,col=colors())
Fabien

Logez Maxime
Messages : 2897
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 22 Mai 2007, 08:05

Bonjour,


Une des façons de faire est d'éliminer les valeurs qui sont supérieures à 1 par exemple de ta représentation. Surtout si tu n'observes ces fortes valeurs qu'une seule fois. Pour ça tu peux utiliser un subset(PC,PC<=1) ce qui revient à PC[PC<=1]. Tu peux aussi chercher quels sont les outlier avec la fonction boxplot ...

Maxime

Fabien Papeil
Messages : 6
Enregistré le : 16 Avr 2007, 12:18

Messagepar Fabien Papeil » 22 Mai 2007, 08:10

Impecable c'est exatcement ce que je voulais, la focntion subset c'est bien pratique.
Une autre petite question, existe t'il dans ce forum une rubrique statistique a proprement parlé. Parce que j'ai un porjet a réaliser mais je ne sais pas bien comment je vais pouvoir m'y prendre,j'aurais besoin de conseil...
En tout cas merci pour votre aide :wink:
Fabien

Romain Lecachey
Messages : 33
Enregistré le : 10 Avr 2007, 08:57

Messagepar Romain Lecachey » 22 Mai 2007, 14:29

Salut à toi aussi Mister Fabien !
Héhé, bien utile les forums ( surtout celui-ci ! ils sont calés les gars ! )
Je pense que tu peux demander à peu près ce que tu veux sur les stats dans ce forum car R est beaucoup utilisé pour cela et on devrait pouvoir te répondre ( peut-être pas moi mais ...)
Bon courage à toi aussi pour ton stage ; ça se termine !
Il va falloir que je pense sérieusement à mon rapport ;-)
@+


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité