Il vaut mieux utiliser la sortie de la fonction summary (tests de Wald) ou des tests du rapport des vraisemblances (LRT) pour juger de l'effet d'un facteur, la seconde option étant préférable pour des raisons statistiques (pb de l'effet Hauck-Donner avec le test de Wald).
Code : Tout sélectionner
> m1 <- glm(Fq ~ E * H * P , family= poisson, data = tt)
> summary(m1)
Call:
glm(formula = Fq ~ E * H * P, family = poisson, data = tt)
Deviance Residuals:
[1] 0 0 0 0 0 0 0 0
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 5.273000 0.071611 73.633 <2e-16 ***
ETRUE 0.005115 0.101145 0.051 0.9597
HTRUE 1.414109 0.079844 17.711 <2e-16 ***
PTRUE -2.328561 0.240333 -9.689 <2e-16 ***
ETRUE:HTRUE -3.434127 0.223470 -15.367 <2e-16 ***
ETRUE:PTRUE 0.714008 0.297494 2.400 0.0164 *
HTRUE:PTRUE -0.407304 0.279710 -1.456 0.1453
ETRUE:HTRUE:PTRUE -0.543092 0.804638 -0.675 0.4997
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 2.2183e+03 on 7 degrees of freedom
Residual deviance: -6.4393e-14 on 0 degrees of freedom
AIC: 62.559
Number of Fisher Scoring iterations: 3
Par exemple, le LRT pour l'interaction d'ordre 2 (3 voies):
Code : Tout sélectionner
> m2 <- update(m1, formula = . ~ . - E:H:P)
>
> anova(m1, m2, test = "Chisq")
Analysis of Deviance Table
Model 1: Fq ~ E * H * P
Model 2: Fq ~ E + H + P + E:H + E:P + H:P
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 0 -6.439e-14
2 1 0.50620 -1 -0.50620 0.47679
Dans ce cas, on a une bonne correspondance entre le test de Wald et le LRT.
Ensuite, il est préférable d'utiliser une procédure appropriée pour sélectionner le "meilleur" modèle. Les comparaisons multiples de modèles pris 2 à 2 sont à proscrire (pas de théorie statistique correcte pour les comparaisons). La fonction "step" offre une procédure pas-à-pas basée sur le critère d'information d'Akaike (AIC) ou d'autres critères: voir l'aide pour des explications.
Code : Tout sélectionner
> m3 <- step(m1, scope = list(lower = . ~ 1, upper = . ~ .), dir = "both")
Start: AIC= 62.56
Fq ~ E * H * P
Df Deviance AIC
- E:H:P 1 0.506 61.065
<none> -6.439e-14 62.559
Step: AIC= 61.07
Fq ~ E + H + P + E:H + E:P + H:P
Df Deviance AIC
<none> 0.51 61.07
+ E:H:P 1 -6.439e-14 62.56
- H:P 1 4.02 62.58
- E:P 1 6.11 64.67
- E:H 1 440.52 499.08
> summary(m3)
Call:
glm(formula = Fq ~ E + H + P + E:H + E:P + H:P, family = poisson,
data = tt)
Deviance Residuals:
1 2 3 4 5 6 7 8
0.13673 -0.60393 -0.03458 0.19461 -0.22102 0.15822 0.07028 -0.06987
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 5.26796 0.07141 73.773 <2e-16 ***
ETRUE 0.01514 0.10007 0.151 0.8798
HTRUE 1.42037 0.07946 17.874 <2e-16 ***
PTRUE -2.27324 0.22112 -10.280 <2e-16 ***
ETRUE:HTRUE -3.48378 0.21439 -16.249 <2e-16 ***
ETRUE:PTRUE 0.62826 0.26657 2.357 0.0184 *
HTRUE:PTRUE -0.48286 0.25313 -1.908 0.0564 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 2218.2642 on 7 degrees of freedom
Residual deviance: 0.5062 on 1 degrees of freedom
AIC: 61.065
Number of Fisher Scoring iterations: 4
Noter que les résultats peuvent être très différents de ceux obtenus avec anova, de la manière dont vous l'avez utilisée: une anova séquentielle est réalisée, les effets étant ajoutés les uns après les autres.
Pour l'interprétation, on peut dire que la ponctuation initiale dépend de la présence d'une majuscule et de la présence d'un "et" en début de phrase (et réciproquement), mais que la ponctuation initiale associée à la présence d'une majuscule ne dépend pas de la présence de "et" en début de phrase (et de même avec les autres combinaisons: P et E ne dépend pas de H, E et H ne dépend pas de P).
Renaud