J'aimerais avoir quelques précisions quant à l'utilisation de ce Package.
(Je travaille sur Ubuntu 16.04 & R version 3.2.3 avec 8 cœurs sur mon poste.) Lorsque je parallélise les calculs pour tuner les paramètres d'un algo type random forrest mon écran se fige et le pc devient inutilisable jusqu’à ce que le traitement soit terminé.
Voici comment je procède :
Code : Tout sélectionner
paramgrid <- data.frame(mtry=seq(1,4,by=1))
cl <- makeCluster(5)
registerDoParallel(cl)
rfopt <-train(target~.,data=donnees_train,method="rf",
trControl=trainControl(method="cv",number=10,search="grid",classProbs=T),
tuneGrid=paramgrid,prox=TRUE,allowParallel=TRUE)
stopCluster(cl)
Du coup ma question est sur cb de clusters max je peux envoyer mes calculs ? Je ne comprends pas pourquoi la semaine passée lorsque j’exécutais mes traitements sur un nombre de lignes équivalent (15 000) avec une grille de paramètres plus large, le PC répondait toujours..
L’écran se fige vient probablement du fait que les calculs engagent de la mémoire SWAP (à la fin du traitement 77% de la mémoire swap est utilisé et donc le PC rame tout autant à la fin..).
J'ajoute également que j'ai obtenu l'erreur suivante :
Code : Tout sélectionner
Error in unserialize(socklist[[n]]) : error reading from connection
Y- a t-il une alternative ?
Cordialement