Je réalise une AFCM sur un petit jeu de données (19 individus, 5 variables) avec le package FactomineR (v1.41) et les procédures MCA et HCPC.
Mon jeu de données :
Code : Tout sélectionner
"ID_Ferme";"C_NbETP";"C_Age";"C_Diplomes";"C_Date_installation";"C_Origine"
"A";"PlusDe5";"30A39";"Bac";"1999A2007";"MA"
"B";"PlusDe5";"30A39";"BacPlus5EtPlus";"2008A2012";"HCF"
"C";"PlusDe1A3";"30A39";"BacPlus234";"2013A2018";"HCF"
"D";"PlusDe3A5";"50EtPlus";"Bac";"1980A1999";"MA"
"E";"PlusDe5";"40A49";"BacPlus5EtPlus";"1980A1999";"MA"
"F";"PlusDe5";"30A39";"BacPlus234";"2013A2018";"HCF"
"G";"PlusDe3A5";"30A39";"BacPlus5EtPlus";"2008A2012";"HCF"
"H";"PlusDe1A3";"50EtPlus";"MoinsBac";"1999A2007";"HCF"
"I";"PlusDe1A3";"40A49";"BacPlus5EtPlus";"2013A2018";"MA"
"J";"PlusDe1A3";"40A49";"Bac";"1980A1999";"MA"
"K";"PlusDe1A3";"30A39";"BacPlus234";"2008A2012";"MA"
"L";"PlusDe1A3";"50EtPlus";"BacPlus234";"1999A2007";"MA"
"M";"PlusDe1A3";"30A39";"Bac";"2008A2012";"HCF"
"N";"1EtMoins";"30A39";"BacPlus234";"2013A2018";"HCF"
"O";"1EtMoins";"50EtPlus";"BacPlus5EtPlus";"2008A2012";"HCF"
"P";"PlusDe3A5";"40A49";"Bac";"1980A1999";"MA"
"Q";"PlusDe3A5";"50EtPlus";"MoinsBac";"1999A2007";"MA"
"R";"1EtMoins";"50EtPlus";"MoinsBac";"1999A2007";"HCF"
"S";"PlusDe3A5";"40A49";"Bac";"1980A1999";"MA"
Que j'analyse avec le code suivant :
Code : Tout sélectionner
library(FactoMineR)
setwd("C:/Users/T_PUECH/Desktop/MonAnalyseStats")
donnees_import=data.frame(read.csv("individus.csv", header = TRUE, sep = ";"))
row.names(donnees_import)=donnees_import[,1]
donnees_import=donnees_import[,-1]
res.MCA=MCA(donnees_import)
res.HCPC=HCPC(res.MCA, graph=TRUE)
A l'issue de la procédure HCHC et au regard du dendrogramme, j'indique à R vouloir regrouper les 19 individus en 3 classes. A l'issue de cette procédure, je vois que les individus A et L appartiennent au même cluster (le 3, en vert).
Or sur le dendrogramme affiché sur le factor map, sur le factor map en lui même et dans le tableau résultats de l'HCPC (res.HCPC$call$X), mes individus A et L appartiennent respectivement au cluster 1 (le noir) et 2 (le rouge).
Pour les autres individus, toutes les représentations sont identiques (les clusters sont inchangés).
Tout ceci me laisse perplexe sur une procédure que j'utilise en routine depuis des années (mais sur des jeux de données beaucoup plus grands qui ne me permettent pas de vérifier 1 par 1 l'affectation de mes individus).
Sauriez vous expliquer ces différences d'affectation des individus A et L ?
Merci de votre aide précieuse !
Thomas