Je cherche à affiner une base de textes (format .txt) en grand nombre pour ne conserver que ceux qui m'intéressent. Après avoir crée un objet "Accordstxt" contenant l'ensemble des textes, j'ai tenté de construire des sous ensemble comme suit :
Code : Tout sélectionner
proroelectro <- grep("prorogations|vote électronique", x = Accordstxt, value = TRUE, fixed = TRUE)
Avec l'idée de construire un objet "proroelectro" qui contiendrait tous les textes dans lesquels on trouverait l'une ou l'autre des occurrences.
Cependant ainsi rédigée cette commande crée un objet vide (character empty), alors que je suis absolument certains qu'il existe des milliers de textes où ces expressions apparaissent exactement sous cette forme. D'ailleurs quand je les recherche indépendamment je les trouve :
Code : Tout sélectionner
prorogations <- grep("prorogations", Accordstxt, value = TRUE, fixed = TRUE)
votelectro <- grep("vote électronique", Accordstxt, value = TRUE, fixed = TRUE)
Je trouve ainsi 6072 textes contenant la chaîne de caractère "prorogations"
et 9000 textes contenant la chaîne "vote électronique"
J'ai donc modifié la commande en précisant, fixed = FALSE
Code : Tout sélectionner
proroelectro <- grep("prorogations|vote électronique", x = Accordstxt, value = TRUE, fixed = FALSE
Qui me renvoie 9098 résultats. C'est mieux mais cela me laisse un peu incertain sur les chaînes de caractère ayant été supprimées. Surtout je ne comprends pas pourquoi la commande ne fonctionne pas avec fixed = TRUE.
Auriez-vous quelques indications à me fournir sur le fonctionnement de cette fonction ?
Vous remerciant par avance de votre attention,
Guillaume