Messagepar Nicolas Bergeron » 01 Avr 2008, 15:41
[quote="François Bonnot"]Dans l'exemple suivant, la fonction duplicated() retourne les positions des lignes dupliquées, à partir de la seconde occurence de chaque ligne :
[code]> (df <- data.frame(x=c("a","b","c","b","d","c"),y=c(1,2,3,2,4,3)))
x y
1 a 1
2 b 2
3 c 3
4 b 2
5 d 4
6 c 3
> duplicated(df)
Bonjour après une recherche dans les anciens messages, je voudrais avoir plus de précision concernant l'utilisation de la function duplicated().
[code]> (df <- data.frame(x=c("a","b","c","b","d","c"),y=c(1,2,3,2,4,3), z=c(1,2,3,4,5,6)))
x y z
1 a 1 1
2 b 2 2
3 c 3 3
4 b 2 4
5 d 4 5
6 c 3 6
Lorsque j'applique la fonction duplicated sur ce data.frame je n'ai aucun doublon et c'est normal. Je voudrais par ailleurs enlever les doublons seulement sur les variables x et y. Puis-je utiliser la fonction duplicated lorsque j'utilise seulement quelques variables et non toutes celles du data frame? J'ai tenter ceci:
df[duplicated(c(1,2)),]
Mais ça ne fonctionne pas! Avez-vous une solution afin de récupérer ces enregistrements. En résumé y-a-t-il un moyen détourné pour spécifier à la fonction duplicated d'utiliser seulement quelques variables?
NicB