J'ai fait une PLS (package PLS). Après étude du SEC et SECv je peux déterminer combien de composantes je dois conserver pour ma lda sur les scores de la PLS (=PLS-DA).
J'ai un petit echantillon donc je valide ma discriminantion par cross validation et j'obtiens la matrice de confusion:
Code : Tout sélectionner
E<-T$Etat
X<-T[,3:8]
Xc<-scale(X,center=TRUE,scale=FALSE)
d.cv<-lda(Xc,E,CV=TRUE)
mat.conf<-table(T$Etat,d.cv$class)
Ma matrice X correspond aux scores de ma PLS donc je peux jouer sur le nombre de composantes de la PLS (T[,3] pour une composante, T[,3:4] pour 2 composantes...) et obtenir ainsi plusieurs matrices de confusion et ainsi garder la meilleur. J'aimerais également pouvoir jouer sur le nombre de composantes de ma lda. Ma variable de réponse à que 3 modalités donc j'aimerais imposer soit 1 soit 2 axes et ainsi obtenir la meilleur combinaison possible (minimum d'erreur - choix raisonnable du nombre de composantes PLS et AFD pour la stabilité !). Comment faire pour choisir le nombre de composantes pour la lda ?
Merci d'avance pour votre aide !
Simon