Bonjour,
Bref, si une bonne âme peut éclaire run peu ma lanterne, je lui vouerai une reconnaissance durable (étant mortelle, enfin je crois, je n'ose utiliser le terme éternelle).
ben là.... obligé de répondre :o)
En bref, Les GEEs (Generalized Estimating Equation, Liang & Zeger 1986, Prentice & Zhao 1991) peuvent être considérer comme une extension des GLM (ex. modèle linéaire généralisé, Nelder & Wedderburn 1972, McCullagh & Nelder 1989) pour l’analyse des données corrélées. Lors de la construction du modèle, on pose une hypothèse concernant la structure de la corrélation au sein des groupes (ex. indépendance, non-structurée, auto-régressif). De plus, on utilise souvent un estimateur de type « sandwich » pour obtenir une estimation robuste de la variance des paramètres et pour la construction des tests et des intervalles des confiances associés à aux paramètres du modèle. Ce type d’estimation est généralement moins sensible aux problèmes d’hétéroscédasticité des données.
Liang, K.Y. & Zeger, S.L. (1986) Longitudinal data analysis using generalized linear models. Biometrika, 73, 13-22.
McCullagh P. & Nelder J. A. (1989) Generalized Linear Models. London: Chapman & Hall/CRC.
Nelder J. A. & Wedderburn R. W. M. (1972) Generalized Linear Models. Journal of the Royal Statistical Society, Series A, 135, 370-384.
Prentic, R.L. & Zha, L.P. (1991). Estimating equations for parameters in means and covariances of multivariate discrete and continuous responses. Biometrics, 47, 825-839.
Liens sur le WEB
http://archimede.mat.ulaval.ca/pages/du ... brooke.pdf
http://www.uquebec.ca/reglog/chapitre12.htm
http://ifr69.vjf.inserm.fr/~webifr/ppt/gee_mc21.ppt
http://daedale.free.fr/doc/partie6.pdf
Avec une mention spéciale pour :
Laura Thomson’s S-PLUS (and R) Manual to Accompany Agresti’s Categorical Data Analysis.
http://math.cl.uh.edu/thompsonla/Splusdiscrete2.pdf
cf chapitre 11.
Højsgaard S. (2004) Modules 14: Generalized Estimation Equations, Master of Applied Statitics,
http://genetics.agrsci.dk/biometry/cour ... module.pdf
Librairie sous R :
gee
geepack
yags
Ils sont souvent en « compétition » avec les GLMM (c’est pas vraiment la même approche du problème). Ils sont pratiques lorsque l’on ne sait pas trop comment organiser les effets dans modèles mixtes (aléatoire ? fixe ? ben c’est pas toujours évident). On fixe un type de matrice de corrélation et on se casse pas trop la tête … mais avec les avantages et les désavantages que cela implique … finalement, c’est toujours la même chose, il faut faire un choix.
L’estimation robuste peut-être aussi très intéressant dans les cas où on a du mal à modéliser correctement cette satanée variance (bien sûr, il ne faut quand même pas en abuser). Il me « semble » un peu plus performant pour les modèles avec des distributions binomiales et plus performant sur les jeux de données plus modestes … mais cela reste à vérifier, personne n’est vraiment clair sur ces points et ça dépend aussi pas mal des interlocuteurs.
en espérant t'avoir aidé un peu :)
@+++
pierre