GLM / Post hoc test.

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Geoffrey Gimonneau
Messages : 23
Enregistré le : 04 Aoû 2011, 19:46

GLM / Post hoc test.

Messagepar Geoffrey Gimonneau » 17 Juin 2012, 19:55

Bonjour,

Je travail sur un jeu de donnée issue d'interactions compétitives entre des larves d'insectes. Ce jeu comprend 3 variables: une variable continue "temps de développement" et deux variables facteurs, "Forme" à deux modalités et "Ratio" à quatre modalités (qui correspondent à 4 densités).
J'ai donc réalisé le glm suivant afin d'observer si le temps de développement de mes deux espèces est différent et varie en fonction de la compétition.

Code : Tout sélectionner

> model2=glm(temps~forme+ratio)
> anova(model2,test="Chi")
Analysis of Deviance Table
Model: gaussian, link: identity
Response: temps
Terms added sequentially (first to last)

      Df Deviance Resid. Df Resid. Dev  Pr(>Chi)   
NULL                    527    1052.72             
forme  1   60.097       526     992.62 1.611e-08 ***
ratio  3    7.791       523     984.83     0.247


Il y a donc une différence de temps de développement entre les formes et pas d'effet compétitif (ratio). Cependant, après avoir réalisé graphiquement la distribution des temps de développement des formes en fonction des ratios, il apparait que pour une même forme, certain ratio présente des durée de développement différent entre eux (et parfois également entre les formes).
Ma question arrive à ce niveau. Je souhaiterai mettre en avant ces différences. J'ai essayé la fonction "glht" mais je n'ai pas réussi à faire les comparaisons souhaitées, ex: modalité 1 de la variable "Forme" vs. toutes les modalités de la variable "ratio". Ce type de comparaison est il possible avec cette fonction.
Merci pour vos conseils

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Re: GLM / Post hoc test.

Messagepar Renaud Lancelot » 22 Juin 2012, 04:08

Geoffrey Gimonneau a écrit :Il y a donc une différence de temps de développement entre les formes et pas d'effet compétitif (ratio).


Vous faites ici une "anova" séquentielle: voir l'aide de ?anova.glm

Specifying a single object gives a sequential analysis of deviance table for that fit. That is, the reductions in the residual deviance as each term of the formula is added in turn are given in as the rows of a table, plus the residual deviances themselves.


Cela signifie que si votre jeu de données est désiquilibré, vous n'aurez pas les mêmes résultats avec

Code : Tout sélectionner

anova(glm(temps ~ forme + ratio))


et

Code : Tout sélectionner

anova(glm(temps ~ ratio + forme))


C'est confusant, n'est-il pas ?

Pour éviter cela, préférer un test du rapport des vraisemblances:

Code : Tout sélectionner

m1 <- glm(temps ~ forme)
m2 <- glm(temps ~ forme + ratio)
anova(m1, m2, test = "Chisq")


NB:

1) pourquoi utiliser glm dans ce cas ? lm ferait très bien l'affaire ici. De plus, si vos données sont gaussiennes, le test approprié est F:

Code : Tout sélectionner

anova(m1, m2, test = "F")


Voir l'aide de anova.glm:

The table will optionally contain test statistics (and P values) comparing the reduction in deviance for the row to the residuals. For models with known dispersion (e.g., binomial and Poisson fits) the chi-squared test is most appropriate, and for those with dispersion estimated by moments (e.g., gaussian, quasibinomial and quasipoisson fits) the F test is most appropriate. Mallows' Cp statistic is the residual deviance plus twice the estimate of σ^2 times the residual degrees of freedom, which is closely related to AIC (and a multiple of it if the dispersion is known). You can also choose "LRT" and "Rao" for likelihood ratio tests and Rao's efficient score test. The former is synonymous with "Chisq" (although both have an asymptotic chi-square distribution).



2) prendre l'habitude de mettre les variables dans un data.frame, et utiliser l'argument data de lm ou glm: cela évite bcp de mauvaises surprises.

Ma question arrive à ce niveau. Je souhaiterai mettre en avant ces différences. J'ai essayé la fonction "glht" mais je n'ai pas réussi à faire les comparaisons souhaitées, ex: modalité 1 de la variable "Forme" vs. toutes les modalités de la variable "ratio". Ce type de comparaison est il possible avec cette fonction.


Je ne comprends pas ce que vous voulez faire ! Quelles sont vos hypothèses nulle et alternatuve ?
Renaud

Geoffrey Gimonneau
Messages : 23
Enregistré le : 04 Aoû 2011, 19:46

Messagepar Geoffrey Gimonneau » 22 Juin 2012, 12:59

Bonjour,

et merci pour votre réponse.
Mes hypothèses nulles sont qu'il n'y pas d'effet forme et ratio sur le temps de développement et alternatives, qu'il y en ai.
Ce que je cherchais à savoir c'est s'il est légitime de vouloir caractériser des différences jugées significative graphiquement mais non statistiquement, notamment pour un même ratio entre deux formes. Il m'est donc necessaire de réaliser des tests multiples. J'ai effectivement laissé le glm et je suis passé par une Anova et un test de TukeyHSD. Cependant, je ne suis pas certain de pouvoir me baser sur les résultats du test de Tukey pour caractériser une différence entre les formes et pour un même ratio dans la mesure ou l'interaction de mon anova n'est pas significative (absente également de mon exemple).


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité