Ne pas compter les doublons

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Karen ZANARDI
Messages : 5
Enregistré le : 19 Sep 2023, 09:43

Ne pas compter les doublons

Messagepar Karen ZANARDI » 12 Mar 2024, 10:55

Bonjour,
Je vais essayer d'être le plus clair possible, je suis débutante en R.

J'ai une base de données composée de 18 colonnes avec une ligne par individu.
Dans la colonne 3 j'ai un matricule unique pour chaque individu et en colonne 18 l'effectif qui est toujours égal à 1 puisque j'ai une ligne pour chaque personne.
J'ajoute les données d'affectation pour chaque individu. Ainsi un agent pouvant avoir plusieurs affectations, des lignes sont doublées. Cela ne me pose pas de problème.

Ce qui me pose problème c'est que dans la colonne 18, chaque ligne compte pour 1. J'aimerai lui dire que si le matricule unique de la colonne 3 est dupliquée au moins une fois alors dans la colonne 18 il ne faut pas avoir plusieurs 1 pour un même matricule unique. J'aimerai qu'il n'y ait rien.
Ainsi, un agent sera bien compté une seule fois et non plusieurs.

J'espère avoir été clair...
Merci de votre aide !

Maxime Deniaux
Messages : 68
Enregistré le : 11 Fév 2022, 22:49
Contact :

Re: Ne pas compter les doublons

Messagepar Maxime Deniaux » 12 Mar 2024, 11:16

Bonjour,

cela aurait été plus simple avec un petit exemple reproductible donc j'en ai fait un, tu me diras si cela correspond à ce que tu as.

Code : Tout sélectionner

df <- data.frame(id = paste(sample(x = seq(1,30,1),size = 30,replace = T)), eff = rep(1,30))


Et donc si j'ai bien compris, tu souhaites garder l'effectif à 1 sur les lignes, sauf celles dont l'id est déjà existant sur les précédentes lignes.

Je te propose ça :

Code : Tout sélectionner

df$eff[which(duplicated(df$id))] <- 0


Te laisse me dire si c'est ce que tu voulais.

Bonne fin de journée

Karen ZANARDI
Messages : 5
Enregistré le : 19 Sep 2023, 09:43

Re: Ne pas compter les doublons

Messagepar Karen ZANARDI » 12 Mar 2024, 12:32

Parfait, c'est exactement ça !
Merci beaucoup !!!


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Google [Bot] et 1 invité

cron