Bonjour à tous,
Je me permets de poster ce message afin d’avoir quelques précisions sur les arbres de décision.
J’ai plusieurs variables environnementales (NTFm2+Diamoy+Hmoy+NTVm2+NTSm2+EAU+Ligneux) et une variable à expliquer qui est la présence ou l’absence d’une espèce (ACRMEL = Lusciniole à moustache).
J’aimerai pouvoir associer un poids différent à mes variables environnementales.
Je travaille avec le package Rpart et j’ai donc essayé de cette manière ;
>rpart(ACRMEL~ NTFm2+Diamoy+Hmoy+NTVm2+NTSm2+EAU+Ligneux ,data=ETE, weights = c(0.1, 0.1, 0.2, 0.1,0.1,0.3,0.1), control=rpart.control(minsplit=5,cp=0))
##j'ai aussi essayé en mettant weights = c(NTFm2=0.1 ....)
Message d’erreur ;
>Error in model.frame.default(formula = ACRMEL ~ NTFm2 + Diamoy + Hmoy + :
les longueurs des variables diffèrent (trouvé pour '(weights)')
Je n’arrive pas à comprendre d’où cela peut venir, surtout que je n’ai pas de NA dans mes données et que toutes mes variables font la même taille……
Ps : Savez-vous comment demander à R de faire en sorte que je ne puisse avoir seulement qu’une seule fois la variable dans tout l’arbre : quelques fois une variable revient à plusieurs niveaux….
En vous remerciant par avance,
Bien cordialement,
Nicolas Bastide