Bonsoir à tous,
J'ai besoin, pour construire un graphique ggplot détaillé (avec moyennes par groupes et barres d'erreurs), de définir au préalable, à partir de mes données complètes "data", un jeu de données "data_msd" avec les moyennes et écart-types de ma variable continue "PR_moy_nbTours" (min=0, max=1) en fonction de deux variables qualitatives "Sequence" et "Class-age" (la première à deux modalités et la seconde à quatre modalités).
Quand je calcule les moyennes par groupes avec la fonction by, j'obtiens des résultats cohérents variant de 0.08 à 0.24. Toutefois, la fonction by ne me permet pas de créer un jeu de données. J'ai donc cherché une solution et découvert la fonction ddply, mais lorsque je l'utilise, j'obtiens des moyennes négatives comprises entre -8.23 et -6.66... Je ne comprends pas du tout...
Voici mon script avec la fonction by :
by(data$PR_moy_nbTours, list(data$Sequence, data$class_age), summary)
Et celui avec la fonction ddply :
data_msd<-ddply(data, .(data$Sequence, data$class_age), summarize, mean=mean(data$PR_moy-nbTours), sd=sd(data$PR_moy_nbTours))
Si quelqu'un voit où est mon erreur et peut me corriger, ce serait un immense soulagement.
D'avance merci!
Bonne soirée,
Maylis Fontaine