Bonjour,
Eric Wajnberg a écrit :3) Une régression log-linéaire (qu'implique un argument "family=poisson" - ou quasipoisson, ce qui est la même chose sur le calcul de la vraisemblance) implique que la variable à modéliser suive une loi de Poisson, donc un comptage. Vous n'avez jamais précisé ceci dans votre question initiale. Il n'était donc pas possible de vous aider plus que ceci.
Je partage l'avis d'Eric, d'autant plus que certaines valeurs sont décimales.
Eric Wajnberg a écrit :4) Accessoirement, passer par une régression log-linéaire implique que la fonction de lien soit la fonction log, et on retombe exactement sur ce que je proposais !
La je ne suis pas entièrement d'accord. Avec une distribution de poisson le lien est en log, mais l'estimation des paramètres se fait au maximum de vraisemblance et donc les paramètres estimés et les prédictions ne sont pas les mêmes. Il en va de même avec une distribution gaussienne. Tu peux prendre un lien log et tu ne retomberas pas du tout sur la même chose.
Code : Tout sélectionner
g1<-glm(m ~ s, family = gaussian(link ="log"))
l1 <- lm(log(m) ~s)
plot(s,m,pch=16,xlab="Année",ylab="Assassinats pour 100 000 habitants",ylim=c(-0.05,40),type="b")
lines(ss, predict(g1, newdata = data.frame(s =ss), type = "response"), col = "green")
lines(ss, exp(predict(l1, newdata = data.frame(s =ss))), col = "blue")
Eric Wajnberg a écrit :4)5) Accessoirement (encore), parler de quasipoisson rajoute juste l'estimation d'un coefficient de surdispersion, mais ne change par l'estimation des paramètres de régression (ça ne change que leur SE). Or vous n'êtes intéressé que par ces coefficients. Si vous avez bien un paramètre de comptage à modéliser, un argument "family=poisson" donnera exactement la même chose.
Tout a fait d'accord, mais je trouve étonnant que lorsqu'on fait ce modèle avec une loi de poisson on a un warnings sur le fait qu'il n'y ait pas que des entiers alors qu'on a pas ce problème avec quasipoisson.
Cordialement,
Maxime