Bonjour,
Je dois réaliser une classification automatique du type kmeans sur la base de données du site UCI.
Cette base comporte un peu plus de 3000 lignes et 58 variables alors quand je réalise kmeans l affichage des cluster est très illisible et donc je me dis que je dois réduire le nombre de variable peut être en effectuant une ACP retenir uniquement les variables qui contribuent plus a la formation des dimensions.
Je ne sais pas comment et j'ai besoin d'aide.
Merci d'avance