tableau moyenne par modalité d'une variable qualitative

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Elodie Defrain
Messages : 21
Enregistré le : 30 Mar 2016, 07:05

tableau moyenne par modalité d'une variable qualitative

Messagepar Elodie Defrain » 10 Mai 2016, 07:35

Bonjour,

j'ai une variable qualitative "Quartier", et une variable quantitative freq, je souhaite obtenir un tableau tel ci dessous, y a t il une commande permettant de l'obtenir directement ? (le format m'importe peu)

----------------------------------------
Quartier | mean(freq)
----------------------------------------
Quartier 1 | 18484
----------------------------------------
Quartier 2 | 14514
----------------------------------------
....

Mickael Canouil
Messages : 1315
Enregistré le : 04 Avr 2011, 08:53
Contact :

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Mickael Canouil » 10 Mai 2016, 07:40

Bonjour,

une possibilité est d'utiliser la fonction "by"

Code : Tout sélectionner

data(Orange)
by(Orange[, "circumference"], Orange[, "Tree"], mean)
Mickaël
mickael.canouil.fr | rlille.fr

Elodie Defrain
Messages : 21
Enregistré le : 30 Mar 2016, 07:05

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Elodie Defrain » 10 Mai 2016, 07:45

parfait merci, est il possible d'ajouter l’écart type ? j'ai essayé de remplacer mean par c(mean,sd) sans résultats

Mickael Canouil
Messages : 1315
Enregistré le : 04 Avr 2011, 08:53
Contact :

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Mickael Canouil » 10 Mai 2016, 07:49

Le by (wrapper de tapply) permet de découper un data.frame selon les modalités d'un facteur et d'appliquer sur chaque morceaux une fonction.
Ainsi, il vous suffit de définir une fonction qui retourne le résultat que vous souhaitez obtenir.
Mickaël
mickael.canouil.fr | rlille.fr

Elodie Defrain
Messages : 21
Enregistré le : 30 Mar 2016, 07:05

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Elodie Defrain » 10 Mai 2016, 07:50

merci beaucoup

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Logez Maxime » 10 Mai 2016, 12:39

Bonjour,

Pour ce genre de manipulation les fonctions du package dplyr sont plus efficaces et beaucoup plus lisibles (à mon sens) :

Code : Tout sélectionner

Orange %>% group_by(Tree) %>% summarise(Mean = mean(circumference), Sd = sd(circumference))
Cordialement,
Maxime

Matthieu Lesnoff
Messages : 120
Enregistré le : 29 Nov 2004, 12:41

Re: tableau moyenne par modalité d'une variable qualitative

Messagepar Matthieu Lesnoff » 11 Mai 2016, 06:57

Bonjour

La fonction 'aggregate' du package de base de R est très pratique car elle renvoie directement un data.frame :

Code : Tout sélectionner

res <- aggregate(v1 ~ f1, data = dat, FUN = mean)
# on peut spécifier plusieurs variables, plusieurs facteurs
# et n'importe quelle autre fonction que la moyenne, p.ex. médiane ci-dessous
res <- aggregate(cbind(v1, v2) ~ f1 + f2 + f3, data = dat, FUN = median)
ML


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité