code de selection de modalités

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Chérif Diallo
Messages : 8
Enregistré le : 12 Mai 2017, 12:48

code de selection de modalités

Messagepar Chérif Diallo » 29 Aoû 2017, 11:46

Bonjour,



j'ai un soucis qui est le suivant:
j'ai une base de 4442 observations avec une variable binaire 0/1 dont les occurrences sont les suivantes (3742 cas de 0 , 700 fois de 1).
Je veux un code permettant de sélectionner de manière aléatoire 700 cas de 0 de la variable binaire) tout en ignorant les 3042 restant parmi les 3742.
jusque là c'est la fonction "sample" que j'ai utilisé mais ma sélection n'est pas bonne.

Pouvez vous m'aider svp?

Pierre-Yves Berrard
Messages : 1029
Enregistré le : 12 Jan 2016, 23:30

Re: code de selection de modalités

Messagepar Pierre-Yves Berrard » 29 Aoû 2017, 12:29

Bonjour,

Pour récuperer les numéros de lignes à sélectionner (dans la base de 4 442 observations) :

Code : Tout sélectionner

sample(which(base$var_bin == 0), 700)
PY

Logez Maxime
Messages : 3138
Enregistré le : 26 Sep 2006, 11:35

Re: code de selection de modalités

Messagepar Logez Maxime » 29 Aoû 2017, 14:57

Bonjour,

avec dplyr :

Code : Tout sélectionner

df %>% group_by(var_bin) %>% sample_n(700)
Cordialement,
Maxime


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité