Comme le titre l'annonce, j'ai un jeu de données particulièrement embêtant :)
Je travaille sur une variable réponse qui est le résultat d'un comptage (nbre d'individus) ; et trois variables explicatives (facteurs : zone /site/années)
les zones etant imbriquées dans les sites et ceux sur trois ans (donc les facteurs ne sont pas indépendants les uns des autres).
Bref j'ai procédé a un GLMM via la fonction glmmPQL du package MASS. J'ai pu ainsi désigner a R les niveaux de hiérarchisation par le biais du "random-effect". Pas de soucis avec ça; j'ai sélectionne les meilleurs modèles
Mais maintenant que j'ai mon modèle, qui m'indique qu'il y a de la variabilité par des p-values significatives pour certains de mes facteurs; j'aimerais savoir où sont ces différences à l’intérieur de mon facteur d’intérêt par un test de comparaison 2 à 2: exemple
Code : Tout sélectionner
> summary(glmmNB4)
Linear mixed-effects model fit by maximum likelihood
Random effects:
Formula: ~1 | site
(Intercept)
StdDev: 0.0002111295
Formula: ~1 | an %in% site
(Intercept) Residual
StdDev: 0.8598265 0.7079011
Variance function:
Structure: fixed weights
Formula: ~invwt
Fixed effects: ind~ zone
Value Std.Error DF t-value p-value
(Intercept) 2.7712215 0.5109248 796 5.423933 0.0000
zoneay -0.9177284 0.1480841 796 -6.197347 0.0000
zoneaz -1.3839359 0.1503676 796 -9.203683 0.0000
zoneba -0.4387141 0.7231228 796 -0.606694 0.5442
zonebb -0.4195107 0.7228318 796 -0.580371 0.5618
zonebx -0.4624727 0.1449736 796 -3.190048 0.0015
zoneby -0.7503929 0.1460463 796 -5.138048 0.0000
zonebz -0.8352260 0.1470520 796 -5.679800 0.0000
zonefa 0.1036970 0.7231129 796 0.143404 0.8860
zonefb 0.9353287 0.7225095 796 1.294556 0.1958
zonefc 0.7125525 0.7224505 796 0.986299 0.3243
zonefd 0.9909830 0.7226167 796 1.371381 0.1706
zonema 0.3365654 0.7229314 796 0.465556 0.6417
zonemb 1.0596543 0.7225802 796 1.466487 0.1429
Rmq: j'ai fait un glm.nb() puis j'ai utilisé le Théta pour procéder a mon glmmPQL ajusté car mes données sont overdispersées.
Donc ma question est : sur R existe t'il un post hoc équivalent du TukeyHSD mais pour données non paramétriques et déséquilibrés? (j'ai vu le package phia pour les glmm mais il me semble que la normalité et l'équilibre du plan font parties des assumptions)
(lsmeans fonctionne avec les glmm?)
Merci de votre aide , et n'hésiter pas a me dire si cette question n'est pas pertinente . Au vue des conditions de ce forum je crois que je me positionne entre les fonctionnalités de R et la question stat :/
Cordialement,
Camille