Variance

Kévin Dubois · Messagepar **Kévin Dubois** » 19 Oct 2019, 12:05

Bonjour à tous,

Je dispose d'un fichier de données répertoriant les résultats d'élections au premiers tour, ainsi que le taux de chomage de communes.

Table de données ici : https://drive.google.com/open?id=1B1GsK ... tBA-iHxg42

Je voudrais savoir si il y a un « effet social » lié à des contextes de précarité dans la variabilité des résultats des votes au premier tour.

Pour cela, j'utilise le principe ANOVA : Analyse de variance avec R.

Code : Tout sélectionner

analyse_variance = aov(TXCHOMAGE2014~Nom_vainqueur_1er_tour)

summary(analyse_variance)

J'obtiens ceci :

Code : Tout sélectionner

> summary(analyse_variance)
                        Df Sum Sq Mean Sq F value Pr(>F)    
Nom_vainqueur_1er_tour   4   1152  288.05   27.49 <2e-16 ***
Residuals              166   1739   10.48                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Très bien, je sais que la p-value est très basse, il y a donc un lien très significatif.

A présent, j'aimerais pouvoir afficher la moyenne et l'écart type du taux de chomage en fonction du champs "Nom_vainqueur_1er_tour". En gros, afficher le taux de chomage des communes catégorisé par les personnes qui ont remporté le premier tours (Mélenchon, Fillon, etc).

Malheureusement, je ne sais pas comment m'y prendre ....

Merci à vous.

Gabriel Terraz · Messagepar **Gabriel Terraz** » 19 Oct 2019, 12:31

Salut,

Si je saisis bien la demande :

Data bidon :

Code : Tout sélectionner

df <- data.frame(taux = rnorm(120,10), candidat = sample(c("Fill","Mel","Ham"), 120, prob =c(20,19,7), replace = T))
head(df)
       taux candidat
1  9.575323     Fill
2 12.271915      Mel
3  8.491268      Mel
4  9.864535     Fill
5  8.579118     Fill
6  9.486574      Mel

Et donc :

Code : Tout sélectionner

ag <- aggregate(taux ~  candidat, data = df, FUN = function(i) c(mean = mean(i), sd = sd(i)))
ag
  candidat  taux.mean    taux.sd
1     Fill  9.8537186  0.9458417
2      Ham 10.1465235  0.8608698
3      Mel 10.2485561  0.9668465

Kévin Dubois · Messagepar **Kévin Dubois** » 19 Oct 2019, 13:08

C'est exactement ça, un grand merci à vous :)

Florent Aubry · Messagepar **Florent Aubry** » 20 Oct 2019, 07:24

Gabriel donne la solution à ta question mais la même question a été posée sur le forum des développeurs de developpez.net, ce qui n'est pas en soi un problème puisque les dépôts ont eu lieu au même moment, et a aussi des réponses dont une qui s'interroge sur l'analyse. Là aussi pas de problème, ce forum est consacré à l'utilisation de R et non aux statistiques, ce qui peut expliquer les différences entre les réponses puisque l'autre est plus généraliste (statistiques sous R).

Groupe des utilisateurs du logiciel R

Variance

Variance

Re: Variance

Re: Variance

Re: Variance

Qui est en ligne