Variance

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Kévin Dubois
Messages : 97
Enregistré le : 25 Mar 2019, 12:07

Variance

Messagepar Kévin Dubois » 19 Oct 2019, 12:05

Bonjour à tous,

Je dispose d'un fichier de données répertoriant les résultats d'élections au premiers tour, ainsi que le taux de chomage de communes.

Table de données ici : https://drive.google.com/open?id=1B1GsK ... tBA-iHxg42

Je voudrais savoir si il y a un « effet social » lié à des contextes de précarité dans la variabilité des résultats des votes au premier tour.

Pour cela, j'utilise le principe ANOVA : Analyse de variance avec R.

Code : Tout sélectionner

analyse_variance = aov(TXCHOMAGE2014~Nom_vainqueur_1er_tour)

summary(analyse_variance)


J'obtiens ceci :

Code : Tout sélectionner

> summary(analyse_variance)
                        Df Sum Sq Mean Sq F value Pr(>F)   
Nom_vainqueur_1er_tour   4   1152  288.05   27.49 <2e-16 ***
Residuals              166   1739   10.48                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Très bien, je sais que la p-value est très basse, il y a donc un lien très significatif.

A présent, j'aimerais pouvoir afficher la moyenne et l'écart type du taux de chomage en fonction du champs "Nom_vainqueur_1er_tour". En gros, afficher le taux de chomage des communes catégorisé par les personnes qui ont remporté le premier tours (Mélenchon, Fillon, etc).

Malheureusement, je ne sais pas comment m'y prendre ....

Merci à vous.

Gabriel Terraz
Messages : 591
Enregistré le : 26 Sep 2011, 15:11

Re: Variance

Messagepar Gabriel Terraz » 19 Oct 2019, 12:31

Salut,

Si je saisis bien la demande :

Data bidon :

Code : Tout sélectionner

df <- data.frame(taux = rnorm(120,10), candidat = sample(c("Fill","Mel","Ham"), 120, prob =c(20,19,7), replace = T))
head(df)
       taux candidat
1  9.575323     Fill
2 12.271915      Mel
3  8.491268      Mel
4  9.864535     Fill
5  8.579118     Fill
6  9.486574      Mel


Et donc :

Code : Tout sélectionner

ag <- aggregate(taux ~  candidat, data = df, FUN = function(i) c(mean = mean(i), sd = sd(i)))
ag
  candidat  taux.mean    taux.sd
1     Fill  9.8537186  0.9458417
2      Ham 10.1465235  0.8608698
3      Mel 10.2485561  0.9668465

Kévin Dubois
Messages : 97
Enregistré le : 25 Mar 2019, 12:07

Re: Variance

Messagepar Kévin Dubois » 19 Oct 2019, 13:08

C'est exactement ça, un grand merci à vous :)

Florent Aubry
Messages : 324
Enregistré le : 25 Juin 2010, 10:21

Re: Variance

Messagepar Florent Aubry » 20 Oct 2019, 07:24

Gabriel donne la solution à ta question mais la même question a été posée sur le forum des développeurs de developpez.net, ce qui n'est pas en soi un problème puisque les dépôts ont eu lieu au même moment, et a aussi des réponses dont une qui s'interroge sur l'analyse. Là aussi pas de problème, ce forum est consacré à l'utilisation de R et non aux statistiques, ce qui peut expliquer les différences entre les réponses puisque l'autre est plus généraliste (statistiques sous R).


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité

cron