Je dispose d'un dataframe qui représente des caractéristiques de personnes, telles que la profession, le sexe, et l'utilisation du télétravail :
Code : Tout sélectionner
data = data.frame(profession = sample(c("artisan", "employe", "cadre supérieur"), 10000, replace = TRUE), sexe = sample(c("M", "F"), 10000, replace = TRUE), en_teletravail = sample(c("Oui", "Non"), 10000, replace = TRUE))
Je souhaiterais créer un nouveau dataframe, issus d'une extraction des valeurs de "data", de telle sorte :
- Qu'il y ait 20% d'hommes et 80% de femmes
- Et, qu'il y ait 60% d'artisans, 20% d'employes, et 20% de cadres supérieur
- Et, qu'il y ait 50% de "Oui" à l'utilisation du télétravail.
Est-il possible de faire ceci sur R ?
Merci