DF1 :
Code : Tout sélectionner
cip13 cip7 ucd13 ucd7 nom_court
1 3400930000649 3000064 NA A 313 50000UI CAPSULE 30
2 3400930001479 3000147 NA A 313 A LA TYROTHRICINE POMMADE TUBE 50G 1/50 G
3 3400930139448 3013944 NA ABACAVIR MYLAN 300 MG 60 CPR
4 3400930089958 3008995 NA ABACAVIR SANDOZ 300 MG CPR 60
5 3400930059968 3005996 NA ABACAVIR/LAM EG 600 MG/300 MG CPR 30
6 3400930076972 3007697 NA ABACAVIR/LAMIVUDINE AUTHOU 600 MG/300 MG 30 COMPRIMES
et DF2 :
Code : Tout sélectionner
drug_source_value count
11 3400932149544 1779
12 3400933591731 1716
25 3400509099012 1143
47 3400892697789 708
74 3400892259765 481
Et je souhaiterais faire un lien entre les codes présents dans ma colonne "drug_source_value" de mon DF2 et ma colonne "cip7" de mon DF1. Or comme vous pouvez le remarquer, ce sont des codes à 13 chiffres versus des codes à 7 chiffres.
Je sais que les fonctions grep et substr permettent de chercher des chaine de caractère, mon problème c'est que je ne cherche pas une chaine en particulier..
Je souhaiterai qu'il cherche ma ligne 1 du cip7 du DF1 dans mon DF2, puis ma ligne 2... ect..
Je sais aussi qu'un lapply me permettrait de faire l'équivalent d'une boucle, mais je ne sais pas comment chercher une chaine de caractère qui est "non définie".
Est ce que quelqu'un aurait une idée pour m'aider à avancer?
Merci d'avance!
Anais