choix de modèle

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

choix de modèle

Messagepar David Berre » 30 Mar 2007, 09:27

Bonjour,

Dans le cadre de mon stage à l'INRA, je suis chargé d'étudier l'effet de la complémentation sur les performances zootechniques d'ovins sénégalais.
Je dispose à cet effet de nombreuses données de suivi pondéral.
Dans un premier temps, je souhaiterais m'interesser à l'importance des effets année et saison de naissance sur les performances.
Pour cela je souhaiterais monter un modèle de type :

Perf = Moyenne + Effet année + Effet saison + E

Afin d'y parvenir, je me suis documenté sur les publications mettant en oeuvre ce genre de modèle, j'ai put ainsi constater la complexité du problème.
Voila les questions que je me pose :

1) Dois-je creer un modèle mixte pour un exemple si simple?

2) Ou puis-je trouver des explication claire pour monter ce modèle sous R ( de nombreuses explication sur SAS sont disponible sur le net ).

3) Dois-je utiliser la méthode graphique ( Lancelot, Lesnoff, Tillard, McDermott, 200) pour determiner les effet fixes ou aléatoire ou puis-je le faire subjectivement.

Par avance merci.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Re: choix de modèle

Messagepar Renaud Lancelot » 31 Mar 2007, 12:03

David Berre a écrit :Bonjour,

Dans le cadre de mon stage à l'INRA, je suis chargé d'étudier l'effet de la complémentation sur les performances zootechniques d'ovins sénégalais.


de Ndiagne, par exemple ;-) ?

Je dispose à cet effet de nombreuses données de suivi pondéral.
Dans un premier temps, je souhaiterais m'interesser à l'importance des effets année et saison de naissance sur les performances.
Pour cela je souhaiterais monter un modèle de type :

Perf = Moyenne + Effet année + Effet saison + E

Afin d'y parvenir, je me suis documenté sur les publications mettant en oeuvre ce genre de modèle, j'ai put ainsi constater la complexité du problème.
Voila les questions que je me pose :

1) Dois-je creer un modèle mixte pour un exemple si simple?


Réponse courte: pas nécessairement, mais il faut utiliser une méthode rendant compte de la structure des données.

De manière plus précise: les données ont une structure inhérente au plan d'observation:
* observations successives sur les mêmes animaux (courbe de croissance)
* animaux regroupés en troupeaux, ce qui est important pour vous dans la mesure où vous étudiez l'effet de la complémentation alimentaire, dont le choix (nature, quantité) dépend de l'éleveur responsable du troupeau. Par ailleurs, d'autres facteurs relatifs au troupeau, observés ou pas, peuvent entraîner une similitude des observations provenant des animaux d'un même troupeau (génétique, santé,...),
* troupeaux regroupés en villages, ce qui est susceptible d'avoir une influence sur les performances animales: conduite au pâturage avec un berger commun à plusieurs troupeaux, disponible alimentaire variable d'un village à l'autre, etc.

Si vous utilisez un modèle d'analyse de variance ordinaire, vous ne pouvez pas rendre compte de cette structure de variance, ce qui est susceptible de conduire à une sous-estimation de la variance réelle, et des conclusions abusives quant aux effets étudiés: la valeur de p estimée par le modèle "ordinaire" sera trop faible et vous aurez tendance à rejeter trop souvent l'hypothèse nulle.

Il y a deux grands types de choix possibles quant aux méthodes:

1. Les modèles marginaux où l'on cherche simplement à corriger cette estilmation de la variance. Dans ce cas, on peut penser aux moindres carrés généralisés (gls = generalized least squares) dont vous trouverez une mise en oeuvre dans la fct gls du package nlme.

2. Les modèles spécifiques des individus (statistiques) où on s'intéresse de plus près à la structure de la variance et permettant de faire une inférence sur les niveaux hiérarchiques supérieurs aux individus (troupeaux, villages). Il s'agit des modèles mixtes. Plusieurs packages en proposent des mises en oeuvre:
- ftc lme dans la package nlme
- fct lmer dans le package lme4

Cette dernière est moins bien carossée que lme (pour le moment) mais permet d'ajuster facilement des modèles difficiles à spécifier dans lme (ou dans la proc MIXED de SAS), tels que les modèles à effets aléatoires croisés. Il y a également une méthode d'estimation MCMC disponible pour lmer (fct mcmcsamp) qui permet de faire des inférences précises sur les effets aléatoires et leur variance.

2) Ou puis-je trouver des explication claire pour monter ce modèle sous R ( de nombreuses explication sur SAS sont disponible sur le net ).


La référence incontournable pour les modèles hiérarchiques et gls avec le package nlme est:

Pinheiro, J. C. & Bates, D. M. Mixed-effect models in S and S-Plus Springer, 2000

Vous trouverez facilement des compléments et exemples sur le net (comme celui dispo sur ce forum). Il y a aussi le package mlmRev disponible sur le CRAN qui propose des exemples classiques (dans la littérature) de modèles mixtes traités avec lme. Voir aussi le package SASmixed qui propose des jeux de données utilisés dans la proc MIXED pour faciliter les comparaisons.


3) Dois-je utiliser la méthode graphique ( Lancelot, Lesnoff, Tillard, McDermott, 200) pour determiner les effet fixes ou aléatoire ou puis-je le faire subjectivement.


Rien d'obligatoire :-) !

Il y a cependant des questions importantes auxquelles il faut répondre:

1. Qu'est-ce que "perf" dans votre analyse ? Un poids à âge type judicieusement choisi (90 j, 1 an ???) ou une courbe de croissance complète dont vous voulez étudier les variations (intercept, pente(s)) selon les pratiques de complémentation ?

2. Comment voulez-vous traiter les effets étudiés ? Il est par exemple possible de considérer l'effet année comme un effet aléatoire, ce qui n'aurait pas de sens pour la saison de naissance. A mon avis (je ne prétends pas détenir LA vérité !), on ne peut considérer comme effets aléatoires que ceux dont on peut considérer qu'ils sont tirés au sort dans une population générale sur laquelle on veut faire une inférence.

Bien cordialement,

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

suite...

Messagepar David Berre » 04 Avr 2007, 08:33

Bonjour,
Tout d'abord merci pour votre aide qui m'a ammené a me poser les bonnes questions.
Suite à une discussion avec mon maitre de stage, il apparait que nous ne donnerons pas d'importance aux differents niveaux d'étude ( troupeaux, villages ), et que nous étudierons des performances judicieusement choisies ( PAT 15, PAT 90, PAT 150 ).

Dans ce cas et au vu de votre dernier mail, il apparait donc inutile de construire un modèle mixte.
Afin de monter le modèle le premier modèle :
PERF = Moyenne + Effet année + Effet saison + E
Je devrais donc utiliser la fonction gls?

De plus, et toujours suite à votre réponse, l'effet complémentation serait donc un effet fixe ( si on considére que nos deux modalités de complémentation représente l'ensemble des modalités possibles)?

Tillard
Messages : 87
Enregistré le : 17 Déc 2004, 10:32

Messagepar Tillard » 04 Avr 2007, 11:51

Bonjour
Tout d'abord merci pour votre aide qui m'a ammené a me poser les bonnes questions.
Suite à une discussion avec mon maitre de stage, il apparait que nous ne donnerons pas d'importance aux differents niveaux d'étude ( troupeaux, villages ), et que nous étudierons des performances judicieusement choisies ( PAT 15, PAT 90, PAT 150 ).

Dans ce cas et au vu de votre dernier mail, il apparait donc inutile de construire un modèle mixte.
Afin de monter le modèle le premier modèle :
PERF = Moyenne + Effet année + Effet saison + E


c'est dommage car vous allez faire tourner 3 modèles (un pour chaque PAT) alors qu'un seul aurait suffit en modelisant la croissance;
De plus, le poids à un age donne ne depend pas QUE de l'annee, de la saison ou de l'effet complementation; que faites vous des effets sexe et taille de la portée (qui conditionne le poids à la naissance) ?
Cordialement
Emmanuel Tillard
UMR ERRC (Elevage des Ruminants en Regions Chaudes)
CIRAD - St PIERRE (La Réunion)
tel: 02 62 49 92 54

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 04 Avr 2007, 19:16

Je suis d'accord avec la réponse d'Emmanuel. Il serait logique de faire un seul modèle avec les différents poids. De même, je pense qu'il est nécessaire d'utiliser un modèle mixte dans la mesure où les variations individuelles sont certainement importantes et qu'il me paraît difficile de faire l'impasse sur un effet du troupeau (hors complémantation). Un modèle gls ne peut pas (avec la mise en oeuvre sous R) représenter cette structure de variance individuelle et troupeau.

En allant jusqu'à 150 j, l'effet du sexe devrait être perceptible (il ne l'est pas à 90 j, par exemple), et l'effet de la portée est certainement important même si les naissances multiples sont peu fréquentes chez les ovins de Ndiagne.

De plus, il n'est pas du tout certain qu'une droite représente correctement la croissance entre les 3 âges ==> il faudra peut-être aller jusqu'à un effet quadratique de l'âge.

Il faudra aussi définir l'effet année et l'effet saison: effet de l'année et de saison de la naissance, ou de la réalisation du poids ? Ce genre de considérations nous avait amené à faire une étude de cohortes d'animaux nés à la même saison et année, pour simplifier les modèles.

Enfin, ne pas oublier que bcp de données ont été recueillies à l'occasion d'essais de vaccins et vermifuges, ces derniers ayant un effet important sur la croissance des agneaux. Il faudra soit tenir compte de ces effets, soit travailler avec des groupes d'animaux homogènes.

Il faudra une étude exploratoire sérieuse pour décider des effets fixes et aléatoires. Du boulot en perspective...

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

Messagepar David Berre » 05 Avr 2007, 13:35

Suite à une discussion avec Mr Moulin, et en considérant les remarques précédentes, nous avons décidé d'étudier le modèle de type :

Perf = m + Effet complémentation + Effet année + Effet sexe + intéraction année-complémentation + E.

Ce modèle sera effectué sur deux groupe d'animaux :

- Les animaux nés en saison 1 ( saison humide = Juillet-Octobre )
- Les animaux nés en saison 2 ( Novembre-Février).

Pour chacun des groupes on aura éliminer les quelques individus issus de portée multiples.

Dans un souci de simplicité, nous travaillerons sur chaque PAT indépendamment
Il sera également difficile de prendre en compte les différents traitement effectués sur les animaux.

Ces simplifications s'avèrent nécessaire car nous sommes limité :

- par le temps ( fin de stage de M1 début Juin, une étude sur les paramètres de reproduction était également prévue)
-par mon efficacité sur l'utilisation de R.

Un modèle de ce type peut-il donner des résultats interprétables en terme d'effet de complémentation?
Si oui, à quel type de modèle sous R dois-je faire appel?

Par avance merci.

Cordialement.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 05 Avr 2007, 16:12

Un modèle de ce type peut-il donner des résultats interprétables en terme d'effet de complémentation?
Si oui, à quel type de modèle sous R dois-je faire appel?


Bonjour,

Ces choix des effets fixes et du plan d'observation me paraissent raisonnables et pertinents.

En ce qui concerne les modèles, vous avez le choix entre un modèle linéaire marginal (on ne s'occupe que des moyennes de pop) de type moindres carrés généralisés (fct gls du package nlme), ou un modèle linéaire à effets mixtes (on regarde la fluctuation aléatoire des moyennes autour des moyennes de pop), par exemple fct lme du package nlme.

Personnellement je choisirais le modèle mixte, avec le troupeau et/ou le village comme effet(s) aléatoire(s), ce qui permet de repérer les troupeaux ou villages s'écartant bcp de la moyenne de pop: cela peut être intéressant et générer des hypothèses. Exemple: à phéntotype animal et à pratique de complémentation constants, y-a-t-il des différences entre villages, liées au groupe ethnique des villageois ?

Dans les deux cas, l'ouvrage de Pinheiro et Bates indiqué précédemment me semble une lecture incontournable. Pour le modèle gls, vous trouverez des exposés dans la plupart des bouquins spécialisés sur la régression linéaire, par exemple:

Draper, N. R. & Smith, Applied Regression Analysis, John Wiley & Sons, Inc., 1998.

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

fonction gls

Messagepar David Berre » 12 Avr 2007, 14:13

Bonjour,
j'ai effectué les premiers tests avec la fonction gls :

modele=gls(PAT15~Année+Complémentation+SEXE,data=mydata)
> summary(modele)
Generalized least squares fit by REML
Model: PAT15 ~ Année + Complémentation + SEXE
Data: mydata
AIC BIC logLik
413.0849 427.5741 -201.5424

Coefficients:
Value Std.Error t-value p-value
(Intercept) 7.350528 10.733812 0.684801 0.4947
Année -0.026620 0.119362 -0.223023 0.8239
Complémentation 0.436139 0.159418 2.735816 0.0071
SEXEM 0.605499 0.175223 3.455582 0.0007

Correlation:
(Intr) Année Cmplém
Année -1.000
Complémentation -0.012 -0.013
SEXEM 0.053 -0.063 0.034

Standardized residuals:
Min Q1 Med Q3 Max
-2.37033039 -0.63183451 0.09660695 0.66027286 2.68232349

Residual standard error: 1.023894
Degrees of freedom: 138 total; 134 residual
Warning message:
abbreviate utilisé avec des caractères non ASCII in: abbreviate(these, minlength, use.classes)


A la vue des p-value, puis-je conclure dans ce cas à une influence de la complémentation (p=0.007) et du sexe(p=0.0007)?

Suita à la lecture de " Time- Series Regression and Generalized least squares; Appendix to an R and S-plus companion to applied regression, john Fox, January 2002 " il me vient également d'autres question :

-Dois-je bien utliser la méthode REML ( par défaut)?
-Dois-je spécifier une structure de corrélation spécifique ( corrélation=?)

Par avance merci.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Re: fonction gls

Messagepar Renaud Lancelot » 13 Avr 2007, 14:15

David Berre a écrit :Bonjour,
j'ai effectué les premiers tests avec la fonction gls :

modele=gls(PAT15~Année+Complémentation+SEXE,data=mydata)


Cette utilisation de gls est équivalente à un modèle des moindres carrés ordinaires (MCO), i.e., observations non corrélées. Elle ne répond pas à vos objectifs de prendre en compte une corrélation des observations intra-trp. Voir l'argument "correlation" et éventuellement l'argument "weights" si vous êtes confronté à une variance résiduelle hétérogène.

> summary(modele)
Generalized least squares fit by REML
Model: PAT15 ~ Année + Complémentation + SEXE
Data: mydata
AIC BIC logLik
413.0849 427.5741 -201.5424

Coefficients:
Value Std.Error t-value p-value
(Intercept) 7.350528 10.733812 0.684801 0.4947
Année -0.026620 0.119362 -0.223023 0.8239
Complémentation 0.436139 0.159418 2.735816 0.0071
SEXEM 0.605499 0.175223 3.455582 0.0007

Correlation:
(Intr) Année Cmplém
Année -1.000
Complémentation -0.012 -0.013
SEXEM 0.053 -0.063 0.034

Standardized residuals:
Min Q1 Med Q3 Max
-2.37033039 -0.63183451 0.09660695 0.66027286 2.68232349

Residual standard error: 1.023894
Degrees of freedom: 138 total; 134 residual
Warning message:
abbreviate utilisé avec des caractères non ASCII in: abbreviate(these, minlength, use.classes)

A la vue des p-value, puis-je conclure dans ce cas à une influence de la complémentation (p=0.007) et du sexe(p=0.0007)?


Non, pour la raison évoquée ci-dessus.

Suita à la lecture de " Time- Series Regression and Generalized least squares; Appendix to an R and S-plus companion to applied regression, john Fox, January 2002 "


C'est une bonne réf mais pas celle qu'il faut pour le package nlme el la fct gls: voir la réf de Pinheiro et Bates.

il me vient également d'autres question :

-Dois-je bien utliser la méthode REML ( par défaut)?


ça dépend :-)

Pour la phase de sélection des modèles (par AIC ou test du rapport des vraisemblances), il est nécessaire d'ajuster les modèles par la méthode ML (mais ça se discute: voir dans Pinheiro et Bates). Quand vous avez sélectionné un modèle et voulez une estimation non biaisée des coefs, en particulier les corrélations et variances, il vaut mieux utiliser REML. Tout ça est expliqué en détail dans P&B.

-Dois-je spécifier une structure de corrélation spécifique ( corrélation=?)


Oui, sinon vous ajustez un modèle des MCO.

Il faut également vérifier si la variance est hétérogène, i.e., varie avec le poids estimé, par exemple. Cas très fréquent (même le plus général) avec la modlisation de données de croissance pondérale. Vous pouvez mettre ça en évidence en faisant un graphe des résidus en fct du poids prédit, qque chose comme:

Code : Tout sélectionner

library(xyplot)
xyplot(residuals(modele) ~ fitted(modele))


Il y a des fct tte prêtes à cet effet dans le package nlme.

Il est indispendable de faire une exploration graphique préalable avant de se lancer dans la modélisation, afin de spécifier un modèle plausible de la corrélation et de la variance résiduelle. Les fcts du package lattice sont très utiles à cet effet. L'auteur de gls et de lme dit lui-même que c'est une étape incontournable.

Cela dit, par expérience personnelle sur ce jeu de données, je dirais qu'un modèle raisonnable pour démarrer pourrait être:

Code : Tout sélectionner

m1 <- gls(PAT15 ~ Année * Complémentation + SEXE,
               correlation = corCompSymm(form = ~ 1 | troupeau),
               weights = varPower(form = ~ fitted(.)),
               method = "ML",
               data = mydata)


où troupeau est une variable indicatrice du troupeau (identificateur du trp, par exemple) présente dans le data.frame mydata.

* Il faut examiner les résidus (tendances, autocorrélation,...) pour savoir si OK.

* Voir aussi si la corrélation est plus forte intra-trp ou intra-village. Comme indiqué dans les mails précédents, si il y a une corrélation intra-trp ET intra-village, il faudra utiliser un modèle mixte pour représenter correctement cette structure. Vous pouvez avoir une idée de ça en ajustant un modèle mixte du style:


Code : Tout sélectionner

m2 <- lme(PAT15 ~ Année * Complémentation + SEXE,
               random = list(troupeau = ~ 1, village = ~ 1),
               method = "REML",
               data = mydata)


où troupeau et village sont des variables présentes dans le data.frame mydata, indicatrices de l'appartenance de l'animal à un trp et un village.

puis:

Code : Tout sélectionner

VarCorr(m2)


pour examiner les composantes de la variance.

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

Messagepar David Berre » 16 Avr 2007, 07:40

Bonjour,

J'ai omis de vous dire que nous avions décidé de négliger les effets troupeaux et les effets villages dans notre modèle.
Les modèles ont pour but de montrer l'influence de la complémentation ( et de la trajectoire de complémentation ) sur le PAT15 pour les animaux nés en saison 2( croissance embryonnaire ) ou en saison 1 ( croissance ).

Dans un modèle plus simple de ce type, qu'advient-il de la fonction gls testé dans mon dernier mail?

Dois-je également dans ce cas tester la structure de corrélation des données?

A ce sujet, j'ai effectué des graphs représentant les "fitted" et les "residuals" grâce à xyplot et je n'observe pas de tendance particulière ( les résidus ne deviennent ni plus grand ni plus petit en fonction de la valeur de la performance zootechnique en question ) , cela est-il un argument suffisant pour utiliser la fonction "corCompSymm" correspondant à une corrélation constante.

Par avance merci.


Cordialement

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 17 Avr 2007, 07:21

David Berre a écrit :Bonjour,

J'ai omis de vous dire que nous avions décidé de négliger les effets troupeaux et les effets villages dans notre modèle.


Vous ne pouvez pas décider de cela sans justification. Le modèle des composantes de la variance que je vous ai indiqué précédemment est fait pour cela. Au vu des résultats, vous pourrez décider de négliger tel ou telle composante, mais votre analyse risquerait d'être biaisée dans ses conclusions si vous sautiez cette étape.

Les modèles ont pour but de montrer l'influence de la complémentation ( et de la trajectoire de complémentation ) sur le PAT15 pour les animaux nés en saison 2( croissance embryonnaire ) ou en saison 1 ( croissance ).

Dans un modèle plus simple de ce type, qu'advient-il de la fonction gls testé dans mon dernier mail?


1. Vous évaluez les composantes de la variance pour voir comment elle se répartit entre inter-village, inter-trp et inter-individu.

2. au vu de cette analyse, vous décidez si un modèle gls est possible ou pas. A mon sens, c'est le cas seulement si une des composantes, voire les deux (village et trp) sont faibles.

3. Vous faites une analyse graphique exploratoire pour voir si la variance est hétérogène ou pas selon les variables étudiées et selon les valeurs ajustées. Si c'est hétérogène, il faut la représenter dans le modèle (gls ou lme).

4. Vous établissez votre modèle et regardez si vous pouvez le simplifier (tests du F, de rapport des vraisemblances, etc.).

Dois-je également dans ce cas tester la structure de corrélation des données?

A ce sujet, j'ai effectué des graphs représentant les "fitted" et les "residuals" grâce à xyplot et je n'observe pas de tendance particulière ( les résidus ne deviennent ni plus grand ni plus petit en fonction de la valeur de la performance zootechnique en question ) , cela est-il un argument suffisant pour utiliser la fonction "corCompSymm" correspondant à une corrélation constante.


* Ce que vous dites est surprenant: ce n'est vraiment pas le cas général.

* La corrélation et l'hétérogénéité de la variance sont des choses différentes. Dans un modèle gls, elles sont prises en charge par deux arguments différents (correlation et weights). Ils sont utilsés pour construire le modèle de la matrice de variance - covariance des résidus: weights pour la diagonale de la matrice, et correlation pour sa structure bloc-diagonale.

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

Messagepar David Berre » 23 Avr 2007, 15:35

Bonjour,

Au début de cette discussion, nous avions émis l'hypothése que l'effet année était un effet aléatoire.
le modèle lme approprié est-il bien alors :

m2 <- lme(PAT15 ~ Complémentation + SEXE,
random = list(troupeau = ~ 1, village = ~ 1,Année = ~ 1),
method = "REML",
data = mydata)


Losque nous mettons en évidence que l'effet troupeau n'amméliore pas le modèle ( et qu'il n'est donc pas nécessaire de paramétrer un modele lme ), est-il possible de stipuler l'effet aléatoire de l'année sur un modèle gls?

En effet, il apparait difficile d'interpréter la "value" du facteur année ( qui se décline en 3 ou en 5 années)


Concernant l'interprétation des résultats, nous nous interrogeons sur la colonne "Value".
les résultats suivants sont issus d'un modèle gls :

Value Std.Error t-value p-value
(Intercept) 6.657994 11.277092 0.590400 0.5560
Année -0.017435 0.125734 - 0.138669 0.8899
Complémentation 0.356311 0.200407 1.777932 0.0778
SEXEM 0.627651 0.181097 3.465829 0.0007



Peut-on conclure dans ce cas que la complémentation permet un gain de poids de 356 g?

Pouvez-vous m'indiquer de la documentation à ce sujet?

Par avance merci de votre aide.

David

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 24 Avr 2007, 21:10

David Berre a écrit :Bonjour,

Au début de cette discussion, nous avions émis l'hypothése que l'effet année était un effet aléatoire.
le modèle lme approprié est-il bien alors :

m2 <- lme(PAT15 ~ Complémentation + SEXE,
random = list(troupeau = ~ 1, village = ~ 1,Année = ~ 1),
method = "REML",
data = mydata)



Nous, c'est malheureusement plus compliqué que cela: lme est fait pour ajuster des modèles hiérarchiques ce qui n'est pas le cas de ce modèle. Il s'agit ici d'effets aléatoires croisés, difficile à mettre en oeuvre avec lme. L'outil de choix est la fct lmer du package lme4, avec laquelle le modèle s'écrirait:

Code : Tout sélectionner

library(lme4) ## à charger sur le CRAN
m2 <- lmer(PAT15 ~  Complémentation + SEXE + (1 | village/troupeau) + (1 | Année),
  method = "REML",
  data = mydata)


(à vérifier car je me plante régulièrement avec l'opérateur / dans les formules: je ne suis pas sûr de l'ordre des effets aléatoires).

Pb avec lmer et les modèles à effets aléatoires croisés: le calcul des ddl du test t devient très problématique, et l'auteur de lmer a préféré ne pas le donner. Pour juger de la signification des effets fixes, il faut alors passer par une estimation par MCMC et calcul des stats d'intérêt sur les chaînes de paramètres qui en résultent. Pas très compliqué mais pas trivial, surtout dans les concepts. Je ne vous conseille pas de vous lancer là-dedans sans un appui sérieux.

Losque nous mettons en évidence que l'effet troupeau n'amméliore pas le modèle ( et qu'il n'est donc pas nécessaire de paramétrer un modele lme ), est-il possible de stipuler l'effet aléatoire de l'année sur un modèle gls?


Oui, je pense, mais alors il faut mettre l'année en effet fixe car il n'existe pas, à ma connaissance, d'équivalent d'effets aléatoires croisés dans le cas de modèle gls.

En effet, il apparait difficile d'interpréter la "value" du facteur année ( qui se décline en 3 ou en 5 années)


Je ne comprends pas ce que vous voulez dire. Avec l'année dans les effets fixes, le pb est que les estimations sont conditionnelles à une certaine valeur de l'année, alors que si vous considérez l'année comme un effet aléatoire, les effets fixes s'interprètent conditionnellement à une année dont l'effet aléatoire est nul. Subtil...

Concernant l'interprétation des résultats, nous nous interrogeons sur la colonne "Value".
les résultats suivants sont issus d'un modèle gls :

Value Std.Error t-value p-value
(Intercept) 6.657994 11.277092 0.590400 0.5560
Année -0.017435 0.125734 - 0.138669 0.8899
Complémentation 0.356311 0.200407 1.777932 0.0778
SEXEM 0.627651 0.181097 3.465829 0.0007



Peut-on conclure dans ce cas que la complémentation permet un gain de poids de 356 g?


Oui mais cet effet n'est pas significatif au seuil alpha = 0.05.

Je suis surpris de l'effet important du sexe: je ne me rappelle pas avoir observé cela (pas de différence mâle / femelle avant 3 mois). Il faudrait regarder de près la qualité des données: vérifier par exemple que l'âge est connu avec précision, et que le phénotype des animaux est homogène. A mon avis, on ne peut garder que les peul-peul (éliminer en particulier les touabire et les djallonke).

Pouvez-vous m'indiquer de la documentation à ce sujet?

Par avance merci de votre aide.

David


Voir n'importe quel bon bouquin sur la régression linéaire pour l'interprétation des coef des effets fixes. J'aime bien:

Draper, N.R., Smith, H., 1998. Applied Regression Analysis. John Wiley & Sons, Inc., New York (USA), 706 p.

où vous aurez aussi des explications claires sur les modèles gls (mais la réf de P&B est meilleure).

Renaud

David Berre
Messages : 18
Enregistré le : 15 Mar 2007, 14:09

Messagepar David Berre » 25 Avr 2007, 07:44

Merci pour votre aide précieuse.

David.

Renaud Lancelot
Messages : 2484
Enregistré le : 16 Déc 2004, 08:01
Contact :

Messagepar Renaud Lancelot » 29 Avr 2007, 07:30

Pour revenir au sujet, c'est-à-dire l'effet de la complémentation sur la croissance. Vous avez trouvé un effet proche du seuil de signification, mais au-dessus malheureusement. Sous réserve de vérifier la qualité des données comme évoqué précédemment, ça vaudrait vraiment la peine de modéliser non pas un poids isolé mais plusieurs: prendre par exemple PAT15 et PAT90 ce qui permet de modéliser la variation de poids par une droite. Vous aurez un modèle plus complexe, mais vous gagnerez en puissance statistique. Vous pourrez alors conclure plus sereinement sur l'existence ou l'absence d'un effet de la complémentation sur la croissance. Le gros écueil de cette analyse est la prise en compte des perdus de vue: cela augmente nettement la difficulté.

Renaud


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité