Bonjour, je suis face à une telle situation et j'ai besoin de votre remarque et suggestion :
Soit un data frame de 9739 lignes avec 21 variables. Dans le dataframe , j'ai une variable catégorie qui contient plusieurs modalités que je dois analyser une par une ( colli, acc, incom,) comme cette sortie suivante (c'est juste un extrait) :
Categorie Marque CoutSinistre Saison Fonction ville age
colli renault 1000 Été Conducteur A 20
acc renault 500 hiver Mécanicien B 30
colli BMW 1000 Été Agent -Nett C 22
colli BMW 500 hiver Conducteur A 20
incom toyota 1000 Été Conducteur A 52
colli BMW 500 hiver Etudiant L 13
incom Ford 1000 automne Conducteur B 23
colli peugeot 500 hiver Conducteur B 25
incom peugeot 500 hiver Conducteur B 25
Alors, je dois analyser modalité par modalité la variable categorie, donc si je fait une extraction de la modalité colli, j'obtiens:
Categorie Marque CoutSinistre Saison Fonction ville age
colli renault 1000 Été Conducteur A 20
colli BMW 1000 Été Agent -Nett C 22
colli BMW 500 hiver Conducteur A 20
colli peugeot 500 hiver Conducteur B 25
colli BMW 500 hiver Conducteur B 25
A votre avis, quelle méthode de DM, je peux utiliser?
Jusque là, au lieu de faire une extraction par modalité, j'ai tout simplement transformé la variable categorie en binaire conformément à la modalité que je veux analyser (Ex: je mets 1 si colli et 0 pour les autres; si je intérsesse à la modalité colli et ainsi de suite pour les autres) et j'ai utilisé une reg logistique, mais mes résultats ne sont pas du tout satisfaisants..
Auriez vous des idées à me proposer ?
Merci par avance