5 résultats trouvés

Aller à la recherche avancée

par Abdel-aziz Traoré
19 Mar 2018, 15:52
Forum : Questions en cours
Sujet : Tirage au hasard de lignes avec des probabilités différentes dans un dataframe
Réponses : 2
Vues : 916

Re: Tirage au hasard de lignes avec des probabilités différentes dans un dataframe

Bonjour,

Normalement ce que vous demandez est faisable avec sample.

Par exemple, pour tirer aléatoirement 3 lignes :

Code : Tout sélectionner


T <- Data[sample(1:nrow(Data),3),]



Il y a un paramètre "prob" dans la fonction sample qui pourrait vous aider.

Cordialement
par Abdel-aziz Traoré
19 Mar 2018, 15:27
Forum : Questions en cours
Sujet : Regrouper des libellés avec kmeans
Réponses : 3
Vues : 934

Re: Regrouper des libellés avec kmeans

Guillaume,

j'ai du mal à adapter cela à mon cas. J'ai près de 1000 lignes à traiter et en terme de levels (de lignes uniques), je devrais être à peu près à 950. je ne peux donc pas m'aider d'une autre table pour pouvoir regrouper mes lignes.

Je ne sais pas si je me fais comprendre
par Abdel-aziz Traoré
19 Mar 2018, 12:45
Forum : Questions en cours
Sujet : Regrouper des libellés avec kmeans
Réponses : 3
Vues : 934

Re: Regrouper des libellés avec kmeans

Guillaume Devailly a écrit :
Sans répondre directement à la question, j'aimerai vous suggérer de jeter un œil au package 'fuzzyjoin' qui semble faire cela (et notamment la fonction stringdist_inner_join)



Merci pour votre réponse.

J'y jette un oeil de ce pas.
par Abdel-aziz Traoré
19 Mar 2018, 10:58
Forum : Questions en cours
Sujet : Regrouper des libellés avec kmeans
Réponses : 3
Vues : 934

Regrouper des libellés avec kmeans

Bonjour, Je fais appel à votre aide car je sèche. J'essaie de reduire la taille de ma base de données en regroupant les données semblables mais qui ne sont pas de vrais doublons. J'ai par exemple : CANCELLATION DATE CANCELATION DATE CANCELLATON DATE que j'aimerais regrouper comme : CANCELLATION DATE...
par Abdel-aziz Traoré
13 Mar 2017, 12:31
Forum : Questions en cours
Sujet : Data Capushe
Réponses : 0
Vues : 1805

Data Capushe

Bonjour, j'essaie de retrouver les données qui servent au package capushe de R qui permet faire une sélection de modèles en se basant sur l'heuristique de pente. https://www.rdocumentation.org/packages/capushe/versions/1.1.1/topics/datacapushe Je pense que j'ai un gros problème de compréhension des ...

Aller à la recherche avancée