Salut Renaud
Pas eu le temps de regarder gof dans metomet.
Renaud Lancelot a écrit :les choses ne me semblent pas aussi claires pour le cas d'une réponse binaire, où le pb se poserait plutôt pour le cas d'échantillons de faible taille. Merci de me dire si je me trompe.
La taille d'échantillon joue sur l'approximation asymptotique de la distribution des statistiques X2 ou D, mais cela est différent de l'effet "sparsness" qui survient quand bcp de "n_i" deviennent petits (l'extrême etant les données binaires où tous les n_i = 1). Pour des "sparses data", la distribution du X2 et D n'est plus un chi-2, même asymptotiquement. Ceci est par exemple expliqué dans McCullagh & Nelder chap 4.4.5 p.120. Si je me rappelle bien, l'effet sparseness tire la distribution de X2 et D vers la gauche (en remarque, un effet surdispersion tire les distributions vers la droite, donc l'un des effets peut masquer l'autre), la distribution devenant complètement dégénérée pour les données binaires (cf M&N).
Renaud Lancelot a écrit :Par ailleurs, pour suivre ce que disent McCullagh et Nelder, il faudrait ajouter un warning sur le risque avec les faibles tailles d'échantillon
Mon avis est que cela semble très délicat. Quelles limites prendre ? Il y a bcp de situations différentes à prendre en compte. Je pense que cela emmène trop loin.
Renaud Lancelot a écrit :et ajouter le test de la déviance. Qu'en penses-tu ?
Oui tu peux ajouter D. Il me semble me rappeler que, dans son bouquin, Collett disait que lorsque D et X2 n'aboutissaient pas au même diagnostic (et étaient donc très différents) cela signifiait que l'approximation chi-2 n'était probablement pas très valide.
Le "goodness of fit" n'est pas un pb simple si on creuse un peu. Pour gof, personnellement j'en resterai à des choses basiques comme le X2 et D. Ou alors il faut se baser sur des choses bien décrites et validées dans la littérature, que je n'ai pas du tout suivie à ce niveau.
Il y a aussi toutes les approches Monte Carlo, cf par exemple thèse Pauline Ezanno, relativement facile à faire sous R mais pas sous la forme d'une fonction standard (il faut faire un peu de script).
En espérant n'avoir pas dit trop de bêtises car je te répond de mémoire, je n'ai +trop les choses précises en tête sur ce sujet.
A+
Matthieu