Webscraping avec rvest et gadgetselector donne character(0)

Postez ici vos questions, réponses, commentaires ou suggestions - Les sujets seront ultérieurement répartis dans les archives par les modérateurs

Modérateur : Groupe des modérateurs

Laurent Grouet
Messages : 5
Enregistré le : 21 Sep 2021, 12:39

Webscraping avec rvest et gadgetselector donne character(0)

Messagepar Laurent Grouet » 18 Oct 2023, 08:19

Bonjour
j'utilise gadgetselector pour recuperer les balises et que je passe à la fonction.Les info que je veux récuperer sur la page sont indentifiés par gadget selector comme : ".experience"
Voici mes commandes

Code : Tout sélectionner

page <- read_html("https://yoopies.fr/recherche-aide-a-domicile/results?auto=1&c=paris")

     References <- page %>%
     html_nodes (".experience") %>%
     html_text()


le résultat est character(0) alors que je voudrais recuperer "24 ans , pas d'expérience"
Quand j'inspecte la ligne selectionnée avec selector gadget j'obtiens

Code : Tout sélectionner

<div data-v-8eb13c4c="" class="experience">
           ** 24 ans, Pas d'expérience**
        </div>


Merci pour votre aide

Laurent

Maxime Deniaux
Messages : 68
Enregistré le : 11 Fév 2022, 22:49
Contact :

Re: Webscraping avec rvest et gadgetselector donne character(0)

Messagepar Maxime Deniaux » 18 Oct 2023, 09:21

Salut,

à mon avis sur ce type de page tu auras plus de chance de réussir à extraire les informations avec le package Rselenium.

Je viens d'essayer avec Rvest de diverses façons, sans réussite comme toi.

Laurent Grouet
Messages : 5
Enregistré le : 21 Sep 2021, 12:39

Re: Webscraping avec rvest et gadgetselector donne character(0)

Messagepar Laurent Grouet » 16 Nov 2023, 14:03

salut ok merci mais Rselenium ça l'ai coton( utilisation recommandée d'un docker)

Maxime Deniaux
Messages : 68
Enregistré le : 11 Fév 2022, 22:49
Contact :

Re: Webscraping avec rvest et gadgetselector donne character(0)

Messagepar Maxime Deniaux » 16 Nov 2023, 14:20

Ouais je sais rvest est beaucoup plus simple à utiliser...mais de ce que je comprends de ta page c'est qu'elle est dynamique (du javascript derrière) et donc avec rvest en théorie c'est pas faisable (de ce que je sais en tout cas donc peux me tromper)


Retourner vers « Questions en cours »

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 1 invité

cron