J’ai créé une typologie à partir de plusieurs variables et j’ai besoin de représenter ces variables sous forme de boxplot pour chaque type créé. J’ai 4 variables explicatives et 4 types (« struct » vaut 1, 2, 3 ou 4).
Voici la forme de la donnée de base :
Code : Tout sélectionner
> data
N_placette prop_PB prop_BM prop_GB prop_TGB struct
4 4 0.00000000 0.47058824 0.52941176 0.00000000 1
5 5 0.15789474 0.52631579 0.26315789 0.05263158 2
6 6 0.33333333 0.58333333 0.08333333 0.00000000 3
8 8 0.11111111 0.44444444 0.44444444 0.00000000 1
9 9 0.14285714 0.50000000 0.28571429 0.07142857 2
10 10 0.23529412 0.41176471 0.23529412 0.11764706 3
11 11 0.15384615 0.61538462 0.15384615 0.07692308 2
Je souhaite donc représenter les boxplot de « prop_PB », « prob_BM », « prop_GB » et « prop_TGB » pour chaque valeur de « struct », et j’aimerai que mon graphique permette de se rendre compte des différentes entre chaque type de struct.
Je voudrais donc construire un graphique ggplot en 4 fenêtres (j’ai utilisé facet_grid(~struct)), et dans chaque fenêtre avoir 4 boxplot : un par variable explicative.
J'ai testé cette solution :
Code : Tout sélectionner
s <- ggplot(data) +
geom_boxplot(aes(x=struct, y=prop_PB))+
geom_boxplot(aes(x=struct, y=prop_BM))+
geom_boxplot(aes(x=struct, y=prop_GB))+
geom_boxplot(aes(x=struct, y=prop_TGB))+
facet_grid(~struct)
s
Mais cela ne fonctionne pas. Je pense que le problème est lié au fait que mes variables sont toutes dans des colonnes séparées mais je ne vois pas comment contourner ce problème.
Dois-je forcément réorganiser mes données ?
J’ai trouvé cette idée sur un forum mais je ne parviens pas à l’utiliser sur mes données (https://stackoverflow.com/questions/21388845/ggplot-arranging-boxplots-of-multiple-y-variables-for-each-group-of-a-continuou) :
Visuellement par rapport à cette image, je voudrais que y.1 à y.4 soient remplacés par les 4 struct, que chaque couleur soit associée à une variable (prop_PB/BM/GB ou TGB).
J'espère que c'est assez clair, merci d'avance de votre aide !
Sabine