Bonjour.
Je souhaite effectuer une la partition (clustering) d'une base de données comprenant 5 variables pour 55 000 individus par le biais de l'algorithme des K-modes.
J'ai essayé de réaliser ce travail avec les fonctionnalités du paquetage klaR (fonction kmodes()). Malheureusement, le temps de calcul devient très vite prohibitif avec le nombre d'observations : après 2h30 de calcul toujours aucun résultat sur l'ensemble de la base.
D'où deux questions :
1.savez-vous s'il existe un moyen d'accroite la rapidité des calculs qui m'aurait échappé (appliquer la fonction kmodes() à une matrice des distance au autre) ;
2.existe-t-il un autre paquetage performant dans le traitement des grandes bases de données par l'algorithme des K-modes.
Merci pour vos réponses.