je suis de retour avec une nouvelle question. J'ai un modèle qui représente un taux de contamination selon des facteurs de conduite de culture (uniquement des variables qualitatives). Etant donné les valeurs de taux de contamination (varient entre 0 et 1 avec un maximum de valeurs entre 0.5 et 0.6), je m'étais dirigée sur une famille binomiale plutot que poisson.
Code : Tout sélectionner
> mod1=glm(Incidence~Az+Var+Con, family="binomial",weights=Nfeuille)
> summary(mod1)
Call:
glm(formula = Incidence ~ Az + Var + Con, family = "binomial",
weights = Nfeuille)
Deviance Residuals:
Min 1Q Median 3Q Max
-4.4854 -0.7473 -0.0263 0.6148 5.2458
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.057587 0.039500 1.458 0.14487
Az150 0.081697 0.030156 2.709 0.00675 **
VarKe 0.436208 0.048131 9.063 < 2e-16 ***
VarLG 0.008759 0.048322 0.181 0.85617
VarNK -0.124632 0.047574 -2.620 0.00880 **
VarSI -0.133770 0.045557 -2.936 0.00332 **
ConS 0.088388 0.030164 2.930 0.00339 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1193.96 on 599 degrees of freedom
Residual deviance: 991.16 on 593 degrees of freedom
AIC: 3269.2
Number of Fisher Scoring iterations: 4
J'ai fait le test du chi 2 de pearson (j'ai suivi les indications d'un lien de Renaud Lancelot sur la sélection de modèles avec l'AIC) et là je trouve que la famille binomiale n'est pas adaptée !
Code : Tout sélectionner
> x1=sum(residuals(mod1,type="pearson")^2)
> dd1=df.residual(mod1)
> 1-pchisq(x1,dd1)
[1] 0
donc nouvel essai en mettant une loi de poisson
Code : Tout sélectionner
> mod2=glm(Incidence~Az+Var+Con+offset(log(Nfeuille)), family="poisson")
There were 50 or more warnings (use warnings() to see the first 50)
> summary(mod2)
Call:
glm(formula = Incidence ~ Az + Var + Con + offset(log(Nfeuille)),
family = "poisson")
Deviance Residuals:
Min 1Q Median 3Q Max
-0.61149 -0.10678 -0.00221 0.08749 0.69975
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.05264 0.14817 -27.352 <2e-16 ***
Az150 0.01767 0.11068 0.160 0.873
VarKe 0.22195 0.16902 1.313 0.189
VarLG 0.14065 0.17615 0.798 0.425
VarNK 0.02093 0.17912 0.117 0.907
VarSI -0.15508 0.17921 -0.865 0.387
ConS -0.01659 0.11068 -0.150 0.881
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 21.564 on 599 degrees of freedom
Residual deviance: 15.919 on 593 degrees of freedom
AIC: Inf
Number of Fisher Scoring iterations: 4
J'ai des warnings qui apparaissent (apparemment ca correspond aux taux de contaminations supérieurs à 0.5) mais le test de pearson a l'air ok
Code : Tout sélectionner
> x2=sum(residuals(mod2,type="pearson")^2)
> dd2=df.residual(mod2)
> 1-pchisq(x2,dd2)
[1] 1
d'où ma question : est-ce que j'ai raté qqch ?