Bonjour,
Je suis actuellement en train de réaliser un dossier de statistiques sur R pour mes cours. Dans ce cadre, on nous à fournit une base de donnée composer de nombreuse variable : Age, Sexe, Ethnie, Religion, Education, Machiavélisme (qui donne les résultats pour chaque individu à chaque question d'un test, nous devons calculer le score, idem pour deux autres variables). Mais je bloque sur plusieurs chose dans la gestion de ma base de donnée. Auriez-vous des suggestions concernant les problèmes suivant ?
1) je souhaite supprimer la variable ethnie de ma dataframe
2) je souhaite regrouper les réponses de chaque participant aux différentes questions en une seule variable (ex. créer une variable MACH-IV qui regroupe les variables / questions MACH-IV 1 à 20).
3) Parmi les réponses à ces questions, certaines réponses sont manquantes, je souhaiterais exclure / supprimer les individus ayant trop de réponse manquante de ma base de donnée, comment savoir combien de fois ils n'ont pas répondu et surtout comment supprimer un individu ?
4) idem, pour la variable sexe, les réponses sont soit 1 (femme); 2 (homme); 3 (autres); 0 (n'a pas répondu), je souhaiterais pour des raisons pratiques en lien avec mes hypothèses à tester ultérieurement supprimer les individus ayant répondu 0 ou 3, comment faire pour qu'ils n'apparaissent plus ?
En espérant avoir été claire et que vous pourrez m'aider :)