Bonjour à tous,
J'ai une problématique relativement simple à comprendre mais pas facile à expliquer ni à mettre en œuvre (pour mon niveau de R) sans de multiples boucles.
J'ai un vecteur composé de mots ou d'expression (des centaines de milliers).
ex :
moto
achat moto
jardinage17t56
D'un autre côté j'ai x (une dizaine) d'autres vecteurs composés eux de mots seuls, et pouvant être de taille différente (de 2 à 300 mots).
ex
v1 v2 v3
voiture vente jardin
moto achat
Ce que je souhaite faire : pour CHACUN des mots ou expression du premier vecteur je veux savoir si un mot (au moins) de chacun des autres vecteurs est présent ou non, avec un indicateur par exemple
ex v1 v2 v3
moto 1 0 0
achat moto 1 1 0
jardinage17t56 0 0 1
Je sais que dans le package stringr, la détection d'un motif est possible mais j'aimerais éviter les boucles ou du moins quelequechose de trop lourd.
Si quelqu'un a une idée ...
Merci