Modérateur : Groupe des modérateurs
Benoît Lamy a écrit :Bonjour à tous, mon stage touche à sa fin.
Je dois remettre mon modèle et mon rapport vendredi soir. J'ai sous la main un modèle binomial, un modèle de Poisson, et j'ai aussi travaillé avec glm.nb pour obtenir une modélisation avec une loi binomiale négative. Mais ces modèles ne collent pas très bien avec ce que j'observe.
Si j'appelle T mon vecteur de sinistres observés
, T1 les valeurs prédites par une loi de Poisson, T2 mes valeurs prédites par une binomiale, T3 les valeurs prédites par une binomiale négative, je me suis dit que peut-être T pouvait être de la forme: T=a*T1+b*T2+c*T3+constante éventuelle
avec a, b et c dépendant des caractéristiques des assurés (encore que, certains des modèles que j'ai créés se ressemblaient énormément).
Mais offset ne semble pas répondre à ce problème, pas plus que les model.extract ou model.offset.
Y a t-il une commande permettant de faire ce que je veux SVP?
Merci.
Code : Tout sélectionner
library(aod)
m1 <- negbin(Toto ~ T1 + T2 + T3 + offset(log(N)), random = ~ 1, data = Data)
Benoît Lamy a écrit :
Si je mets simplement: Toto~T1+T2+T3+F1+F2+F3+...+offset(log(N)), l'ordinateur ne va pas me donner ce que je veux.
Voilà, j'espère avoir été plus compréhensible.
Benoît Lamy a écrit :La base de la réflexion n'était quand même pas si stupide:
on sait (enfin, des personnes pensent) que la loi des sinistres suit une Poisson, d'autres disent que cela s'ajuste mieux avec une binomiale négative. Quoi de plus normal que de se dire que: Toto = a*T1+b*T2, en prenant a et b fixes (ne dépendant de rien) dans un premier temps, puis de se demander si on ne pourrait pas gagner en précision en se disant que a et b peuvent dépendre des caractéristiques?
Pour moi, la base statistique est bonne, ce que je ne comprends pas, c'est que les résultats soient aussi peu encourageants; un problème dans mon code R, peut-être?
Ah, et je me suis souvenu pourquoi je préférais le glm.nb au negbin; parce que le negbin ne permet pas l'argument weights; or il est évident qu'une ligne avec énormément de clients et d'exposition est plus significative et doit être traitée différemment qu'une ligne avec peu d'exposition au risque.
Retourner vers « Questions en cours »
Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité