question sur boxplot

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

question sur boxplot

Messagepar Couanais Pierre » 24 Juil 2008, 16:57

Bonjour à tous,

Je souhaite faire un boxplot de vecteurs de données, tout en enlevant les valeurs aberrantes... Mais comment trouver ces dernières? En enlevant les res$out? Ou en enlevant celles supérieurs à 2 fois l'ecart type?

Merci d'avance

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 24 Juil 2008, 18:57

je ne sais pas si ça va vous aider mais dans boxplot on trouve l'option "outline" que l'on peut passer à FALSE pour ne pas afficher les outliers.
Dans ce cas l'axe garde cependant la même échelle que si on fait apparaitre les outliers. Il suffit alors de jouer sur le paramètre ylim pour supprimer le problème.

Nicolas

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 25 Juil 2008, 07:06

Re,

veux-tu représenter tes données mais sans faire afficher les outliers ? ou veux-tu enlever les outliers du calcul et ensuite représenter les données ? Ce n'est pas la même chose, les représentations graphiques ne seront pas les mêmes.

Si tu veux juste les omettre de la représentation graphique :

Code : Tout sélectionner

y <- rnorm(100)
x <- gl(5,20)
y[sample(1:100,5)] <- 20
boxplot(y~x,ylim=range(boxplot(y~x,plot=FALSE)$stats),outline =FALSE)

# a comparer avec
boxplot(y~x)


Maxime

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 25 Juil 2008, 08:30

Merci à tous les 2 de votre réponse! Oui je me suis aperçu que ce n'était pas la même chose Maxime. Que vaut il mieux faire alors? Les enlever complétement ou juste ne pas les représenter graphiquement selon vous ?

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 25 Juil 2008, 08:49

Et d'ailleurs, question supplémentaire désolé, comment sont calculés les outliers ?

Merci d'avance

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Messagepar Logez Maxime » 25 Juil 2008, 09:09

Re,

Pour la première question c'est a toi de voir. Perso je suis assez d'accord avec la remarque de Renaud dans un de ces précédents posts disant que si tu les enlèves de la représentation tu perds de l'information quand à la vrai nature de ta distribution.

Pour la deuxième question :
?boxplot.stats

Maxime

Nicolas Péru
Messages : 1408
Enregistré le : 07 Aoû 2006, 08:13

Messagepar Nicolas Péru » 25 Juil 2008, 09:35

Moi en général je réponds que ça dépend de l'originie des outliers. Dans le cas de mesure de dimension par exemple si on mesure un objet qui sort de l'ordinaire on peut s'attendre à ce que cela donne un outlier. A ce moment là il ne parait pas inutile de supprimer la mesure en question.
Dans le doute on garde les outliers si aucune précision ne peut aider à connaitre leur origine.

Nicolas

Couanais Pierre
Messages : 213
Enregistré le : 26 Fév 2007, 12:41

Messagepar Couanais Pierre » 25 Juil 2008, 14:46

Merci bien pour tout!


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité