Je possède un dataframe qui indique, en colonne, une url.
Code : Tout sélectionner
test = data.frame(id = 1, url = "https://www.georisques.gouv.fr/risques/installations/donnees/details/0030.12015")
En me servant de celle-ci, je voudrais récupérer un élément dans la page web. Plus précisément, je voudrais récupérer la valeur de l'état d'activité.
https://zupimages.net/viewer.php?id=20/51/t1fx.png
Grâce à mes recherches, j'ai pu trouver un code qui permet de sélectionner l'élément grâce à son "XPath".
Code : Tout sélectionner
library(rvest)
page = read_html("https://www.georisques.gouv.fr/risques/installations/donnees/details/0030.12015")
page %>% html_nodes(xpath = '//*[@id="detailAttributFiche"]/div/p') %>% html_text() %>% as.character()
character(0)
Comme on peut le voir, j'ai systématiquement un "character(0)" qui apparait, comme s'il n'arrivait pas à lire toute la page. Je soupçonne une partie JavaScript qui ne se lie pas correctement ...
Comment puis-je faire ?
Merci.