Sélection de lignes d'une base de donnée à partir de plusieurs variables

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Nacim OUAHES
Messages : 4
Enregistré le : 07 Mar 2019, 08:48

Sélection de lignes d'une base de donnée à partir de plusieurs variables

Messagepar Nacim OUAHES » 09 Mar 2019, 09:46

Bonjour,

J'ai une immense base de donnée de près de 15000 individus. J'aimerais sélectionné des sous populations afin de réaliser des traitements dessus (tri à plat, ACM, ect.). Cette sélection doit se faire à partir des variables "conso_tabac" et "conso_ecig" (cigarette électronique). La variable "conso_tabac" est quantitative (1,2,3,ect.) tandis que la variable "conso-ecig" a été recodé en factor (tous les jours, au moins une fois par semaine, ect.).

Les sous-populations que je souhaite sélectionnée sont les suivants :
_Les fumeurs exclusifs (qui fume seulement la cigarette, donc qui n'utilise pas la e-cigarette).
_Les fumeurs et "vapoteurs" (qui utilise les deux).
_Les vapoteurs exclusifs (qui utilise seulement la e-cigarette).
_Les non-fumeurs & non-vapoteurs.

Merci par avance pour votre aide.

Cordialement.

Serge Rapenne
Messages : 1263
Enregistré le : 20 Aoû 2007, 15:17
Contact :

Re: Sélection de lignes d'une base de donnée à partir de plusieurs variables

Messagepar Serge Rapenne » 09 Mar 2019, 12:53

Bonjour,

il y a plein de maniere de faire des sélections dans un df dans R.
2 possibles : la fonction subset ou la fonction filter du package dplyr

Code : Tout sélectionner

?subset

library(dplyr)
?filter

pour les détails

Serge


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Bing [Bot] et 1 invité