Toujours dans la série des questions simples, en voici un petit groupe qui est digne de questions de cas d’école qui pourraientt être transposées à une enquête agro de terrain :
Dans le cadre du Plan de Déplacement Entreprise (PDE) Agropolis, j’aimerai tenter de traiter par R (histoire de m’entraîner et de mettre cet outil en avant) les résultats de l’enquête en ligne menée ces derniers jours
J’ai mis en ligne un extrait des résultats : http://ecotrop.cirad.fr/temp/test.csv (12 questions et 50 enregistrements)
Chaque colonne est une question, chaque ligne l’ensemble des réponses d’un internaute.
La dernière colonne (fin) est primordiale car elle m’indique que l’internaute est allé jusqu’à la fin du questionnaire (dans ce cas, fin=1).
Je ne veux pas virer tous les fin=0 car des internautes peuvent avoir rempli partiellement leurs questionnaires, je traiterai un jour ces résultats là de façon particulière plus tard.
Sachant que je débute sous R, j’aimerai bien qu’on me guide un peu par rapport à ce que je veux sortir de cette enquête.
Voici mon script pour récupérer les données du fichier, pour le reste, je galère sérieusement…
Code : Tout sélectionner
don<-read.table("http://ecotrop.cirad.fr/temp/test.csv",header=TRUE,sep=";",quote="",dec=",")
don
# nb de réponse
length(don[,1])
# nb de réponse complete
length(don[,1][don["fin"]==1])
# nb de réponse incomplete
length(don[,1][don["fin"]==0])
# lister les X1_1 (en virant les NA et les fin==0)
x1_1<-as.matrix(na.omit(don["X1_1"][don["fin"]==1]))
x1_1
# Comment grouper par classe de réponse à X1_1???
Voici mes questions typiques, j’arriverai rapidement à traiter toutes les questions (y’en a plus de 50) sur cette base:
Pour X1_1, quel est le pourcentage de réponse par classe (de 1 à 6) pour ceux qui sont allés jusqu’à la fin du questionnaire (fin==1) en ignorant les NA
Par exemple : X1_1=1 sont 10%, X1_1=2 sont 30%, X1_1=3 sont 27%, …
Pour X1_3, quel est le taux de réponse avec la valeur 1, avec la valeur 2 pour ceux qui sont allés jusqu’à la fin du questionnaire (fin==1)
Par exemple : X1_3=1 sont 65%, X1_3=2 sont 30% et X1_3=NA sont 5%
Pour toutes les tranches de X10_1, quel est le pourcentage de réponse par tranche de X2_1 (pour ceux qui sont allés jusqu’à la fin du questionnaire (fin==1) )
Par exemple :
Pour X10_1=4, x% ont X2_1=4, y% ont X2_1=5, z% ont X2_1=6,…
Pour X10_1=5, t% ont X2_1=4, u% ont X2_1=5, v% ont X2_1=6,…
…
Pour X10_1=NA, a% ont X2_1=4, b% ont X2_1=5, c% ont X2_1=6,…
Je sais que j’abuse un peu de poser ce genre de question, mais je suis sûr que c’est relativement simple pour certains d’entre vous alors que ça me parait être une montagne pour moi… en tout cas, je m’use sur ces détails…. :cry: