Je suis en stage à l’Université de Toulouse et je travaille sur des données qui recensent le nombre d’ectoparasites (Tracheliastes polycolpus) sur une espèce de poisson (la Vandoise).
Les données ont été récoltées dans 8 stations hydrographiques au sein d’une même rivière. La distance à la source de ces stations varie entre 40 et 130 km. En outre, la « récolte » des données a eu lieu pendant les étés (juin-juillet) 2006, 2007 et 2008 (prochainement 2009).Pour toutes les stations et ceci chaque année, entre 5 et 25 vandoises sont capturées pour quantifier leur nombre de parasites (on peut considérer le taux de recapture comme nul).
Je souhaite dans un premier temps expliquer les variations dans la quantité de parasites que l'on peut observer à tous les niveaux. Pour cela je dispose d’une part de données physico-chimiques relatives aux stations (relevées chaque année pendant les captures), et d'autre part des données morphométriques et génétiques relatives aux vandoises. Le fait que les individus-poissons ne soient pas les mêmes d’une année à l’autre me bloque un peu...
Voici une partie de mon tableau de données en espérant que cela éclaircisse mes propos :
Code : Tout sélectionner
annee station ind poids parasite age taille genet1 genet2 ...variables des stations...
1 a2006 BAN v1 182.8 21 8 237.265 0.6667 0.0737000 ...
2 a2006 CAP v120 188.0 16 5 246.264 0.7333 0.0184000 ...
3 a2007 FUE v96 17.8 3 2 113.334 0.6667 0.0976000 ...
4 a2006 SER v26 33.9 6 5 141.246 0.7333 0.0013918 ...
5 a2006 SER v3 75.2 8 3 191.329 0.7333 -0.0039189 ...
6 a2008 CAL v405 175.0 1 7 242.000 0.7000 -0.0200000 ...
1) Est-ce qu'il est correct d'écrire la structure de mon modèle ainsi ? :
Code : Tout sélectionner
m1 = lmer ( parasite_tot ~ "variables" + (1|annee/station) , data = … , family = "quasipoisson" )
D’après ce que j’ai cru comprendre dans le livre de J.C. Pinheiro et D.M. Bates (Mixed-Effects Models in S and S-plus, Springer 2002, Chap.5, Section 5.3), l’argument correlation de la fonction lme (glmmPQL) permet de prendre en compte une correlation spatiale ou temporelle des résidus au sein des groupes.
2) Est-ce qu’il est possible de tester la correlation spatiale et temporelle des résidus de mon modèle entre les groupes avec la fonction lme (glmmPQL), lmer ou d'autres ?
Merci pour votre aide.
Maxime