Factor Analysis of Mixed Data sur R

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Damien Garcia
Messages : 1
Enregistré le : 07 Avr 2022, 09:22

Factor Analysis of Mixed Data sur R

Messagepar Damien Garcia » 10 Avr 2022, 12:27

Bonjour,

Je souhaite réaliser une Analyse factorielle de données mixtes (FAMD) sur R. Pour la réaliser, j'utilise la fonction "FAMD" du package FactoMineR :
famd<-FAMD(famd_matrix,ncp=5,graph=TRUE,sup.var=NULL,ind.sup=NULL,axes=c(1,2),tab.disj=NULL)

Cependant, ma matrice de base composée de variables quantitatives et qualitatives, comporte des valeurs manquantes. Enlever les individus ou les variables comportant des valeurs manquantes, n'a pas de sens dans ce cas ci. Donc en amont de la FAMD, je réalise une imputation des données manquantes grâce à la fonction "imputeFAMD". Pour appliquer cette fonction, je dois au préalable estimer le nombre de dimensions nécessaire. Pour cela, j'applique la fonction "estim_ncpFAMD" :
nb_dim<-estim_ncpFAMD(famd_matrix,ncp.max=5)

En faisant tourné le script, j'obtiens le message d'erreur suivant pour la fonction "estim_ncpFAMD" :
Error in `[.data.frame`(jeu, , (nbquanti + 1):ncol(jeu), drop = F) :
undefined columns selected

Je me trouve actuellement complètement bloqué car je n'arrive pas à résoudre le problème. Je pense que cela pourrait venir de ma matrice de base mais sans certitude ni pistes de résolution du problème. Je vous partage donc mon problème dans l'espoir que quelqu'un puisse m'aider. Merci d'avance pour vos réponses.

Si besoin, voici une partie de la matrice utilisée.
str(famd_matrix)
'data.frame': 155 obs. of 19 variables:
$ A1 : int 21 23 21 21 22 20 21 23 22 18 ...
$ A2 : int 13 11 11 9 10 11 9 10 9 8 ...
$ A3 : int 9 10 8 10 10 9 9 11 11 9 ...
$ AP : int 36 40 35 36 36 36 32 40 36 34 ...
$ DM : int 41 45 40 40 42 43 40 46 44 37 ...
$ EP : chr "Forme1" "Forme2" "Forme2" "Forme2" ...
$ HA : int 9 11 11 11 12 12 10 12 11 9 ...
$ HM : int 25 30 23 27 30 31 29 34 34 26 ...
$ LA : int 67 73 70 73 73 78 68 80 72 69 ...
$ LL : int 67 72 65 70 71 75 64 76 70 66 ...
$ PF : chr "Profil1" "Profil1" "Profil2" "Profil3" ...
$ PP : int 23 28 25 25 NA 25 24 28 28 NA ...
$ PS : num 33 35 31 34 NA 36 31 39 35 NA ...
$ RDM : num 0.612 0.625 0.615 0.571 0.592 0.573 0.625 0.605 0.629 0.561 ...
$ R21 : num 0.619 0.478 0.524 0.429 0.455 0.55 0.429 0.435 0.409 0.444 ...
$ Bord_posterieur.Periprocte: num 10 8 6 8 NA 10 7 8 6 NA ...
$ Largeur_ambulacre_A4 : num 10 10 9 8 10 10 9 12 9 9 ...
$ Largeur_ambulacre_A5 : num 10 11 9 9 11 11 9 11 10 9 ...
$ Somme_largeurs_petales : int 29 31 26 27 31 30 27 34 30 27 ...

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Re: Factor Analysis of Mixed Data sur R

Messagepar Logez Maxime » 12 Avr 2022, 17:25

Bonjour,

sans les données il est difficile de pouvoir te dire d'où provient ce message d'erreur.
Pour t'en sortir tu peux "débugger" la fonction qui te pose problème, lancer ton code et voir pas à pas ce qui est fait pour identifier ce qui pose problème par la suite :

Code : Tout sélectionner

debug(estim_ncpFAMD)
estim_ncpFAMD(famd_matrix,ncp.max=5)
# ...
undebug(estim_ncpFAMD)
Cordialement,
Maxime


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité