GLM sorties manquantes ?

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Guillaume Martel
Messages : 1
Enregistré le : 26 Aoû 2020, 07:22

GLM sorties manquantes ?

Messagepar Guillaume Martel » 12 Nov 2020, 16:54

Bonjour à toutes et tous,
Après avoir regardé de nombreux posts sur les GLM, je n'ai pas réussi à trouver la réponse à mon problème qui suit:
J'ai une variable (total_egg_system) qui peut varier en fonction de deux facteurs "plant" et "bh", tous les deux qualitatifs. Je prends en compte l’interaction possible entre les deux facteurs. Le facteur "plant" a deux niveaux "b" et "m" et le facteur "bh" a trois niveaux "D1", "D5" et "D15". Ma variable suit une loi de poisson, c'est du comptage.

ma formule est donc la suivante: glm1<-glm(formula = total_egg_system ~ plant * bh, family = poisson())

Mon problème, c'est que quand je fais summary(glm1), je n'ai pas les sorties pour tous les niveaux de facteurs (par exmple, aucune trace de "b" ni de "D1") et je ne peux pas dire quel(s) facteurs ont un effet significatif sur ma variable, ce que j'obtiens très simplement avec une ANOVA à 2 facteurs par contre. Bon dans mon exemple, tout est significatif, mais j'aimerais savoir comment m'y prendre dans le cas général. Si la réponse existe déjà sur le forum, je ne l'ai pas trouvée, mais mea culpa pour le doublon !!

> summary(glm1)

Call:
glm(formula = total_egg_system ~ plant * bh, family = poisson())

Deviance Residuals:
Min 1Q Median 3Q Max
-9.7128 -2.7648 -0.4334 1.2412 13.9144

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.3218 0.1155 11.447 < 2e-16 ***
plantm 0.6419 0.1487 4.317 1.58e-05 ***
bhD15 3.6313 0.1175 30.907 < 2e-16 ***
bhD5 2.9315 0.1184 24.766 < 2e-16 ***
plantm:bhD15 -0.4974 0.1516 -3.281 0.001034 **
plantm:bhD5 -0.5738 0.1530 -3.750 0.000177 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

Null deviance: 8184.7 on 107 degrees of freedom
Residual deviance: 2280.4 on 102 degrees of freedom
AIC: 2862.8

Number of Fisher Scoring iterations: 5



Merci beaucoup pour vos indications !

Guillaume

Eric Wajnberg
Messages : 776
Enregistré le : 11 Aoû 2008, 15:37
Contact :

Re: GLM sorties manquantes ?

Messagepar Eric Wajnberg » 13 Nov 2020, 06:05

Votre question est une question de statistique, pas une question sur le logiciel R. Vous êtes hors-sujet sur ce forum.

Rapidement, un GLM - comme une simple ANOVA - est un modèle de régression surdimensionné. On ne peut pas estimer tous les paramètres de la régression. Le moyen adopté pour contourner ce problème est de prendre - pour chaque facteur - une modalité qui tient lieu de référence (dans R, par défaut, c'est la première par ordre alphabétique: ici "b" pour "plante", et "D1" pour "bh"), et de tester les autres modalités par rapport à ce niveau de référence. Les effets que vous voyez dans les sorties de summary() sont donc par rapport à ces modalités prises comme référence. Il est donc normal que vous ne voyiez pas ces modalités de référence dans les sorties de summary().

Je vous invite à vous (re)plonger dans une ouvrage qui décrit l'ANOVA et ses dérivés.

Cordialement, Eric.


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité