Je me forme depuis peu de temps à R, et j'ai encore du mal avec certains concepts.
J'ai deux dataset (ici fictifs): Un premier avec une simple liste de mots
Code : Tout sélectionner
word
1 avance
2 bien
3 bien
4 bien
5 bon
6 mal
Et un second avec des paires de mots
Code : Tout sélectionner
word first second
1 arrive pas arrive pas
2 pas bien pas bien
3 bien sûr bien sûr
4 sans souci sans souci
5 aucun souci aucun souci
6 mal fait mal fait
J'aimerais retirer de la première liste les mots qui font doublon avec la seconde (dans la colonne 'first' ou 'second'), mais en prenant en compte le nombre d'occurrences qui fait doublon.
C'est à dire que j'aimerais retirer de la première liste 2 occurrences du mot "bien" puisque qu'on en retrouve 2 dans les colonnes 'first' et 'second' du deuxième set, mais pas la troisième occurence.
J'ai trouvé des explications pour retirer tous les doublons mais ce n'est pas ce dont j'ai besoin ici.
J'espère que je suis claire. N'hésitez pas à me questionner si je me suis mal exprimée.
Merci beaucoup !