undefined

Régler la pagination (avec le bouton "Charger plus")

Thursday, July 01, 2021 5:09 PM

Le tutoriel mis à jour pour la dernière version 8.2 d'Octoparse est disponible. Allez consulter maintenant!

De nombreux sites Web utilisent le bouton "Charger plus" ou "Afficher plus" pour charger leur contenu continuellement. Cette technique est très couramment utilisée par les sites Web, dans le but de créer une meilleure expérience aux utilisateurs.

 

mceclip0.png

Contrairement à la pagination avec un bouton "Suivant", le bouton "Charger plus" continue d'ajouter de nouveau contenu sur la même page Web, ce qui le rend plus difficile à gratter. Dans cet article, nous vous montrerons comment régler le bouton "Charger plus" dans Octoparse.

 

1. Utiliser l'auto-détection pour gérer le bouton "Charger plus"

2. Créer une action de pagination manuellement

 

1. Utiliser l'auto-détection pour gérer le bouton "Charger plus"

Si vous créez une nouvelle tâche avec l'auto-détection, Octoparse cherchera le bouton "Charger plus" sur la page Web. Nous utiliserons cette page Web (https://www.capterra.com/search/category?search=CRM%20Software) pour la démonstration.

Démarrez le processus d'auto-détection et l'option de cliquer sur le bouton "Charger plus" sera offerte dans le panneau Tips.

auto_detect_load_more.gif

  • Cliquez sur "Vérifier" pour voir si Octoparse a sélectionné le bon bouton. Si vous constatez que le bouton n'est pas sélectionné correctement, vous pouvez cliquer sur "Modifier" pour le sélectionner manuellement et saisir le nombre de clics souhaité.

check.gif

  • Cliquez sur "Créer un workflow" pour générer les paramètres.

mceclip0.png

  • Si, pour une raison quelconque, Octoparse ne parvient pas à détecter le bouton "Charger plus" pendant le processus d'auto-détection, vous pouvez d'abord créer le workflow, puis choisissez l'option "Cliquez sur le bouton Charger plus". Suivez les conseils pour sélectionner le bouton "Charger plus" sur la page Web et entrez le nombre de clics souhaité.

mceclip1.png

 

Notez qu'il y a deux éléments de boucle dans le workflow généré. Par conséquent, Octoparse continuera à cliquer sur le bouton "Charger plus" un certain nombre de fois avant de commencer à gratter la liste des éléments.

workflow1.png

 

 

2. Créer une action de pagination manuellement

Quand l'auto-détection ne fonctionne pas ou vous créez une tâche de grattage sans utiliser l'auto-détection, vous pouvez toujours gérer le bouton "Charger plus" par créer manuellement une action de pagination.

  • Sélectionnez le bouton "Charger plus" sur la page Web et choisissez "Cliquer en boucle sur chaque bouton"
  • Configurez un délai d'expiration AJAX approprié (Qu'est-ce qu'AJAX?)

manually_load_more.gif

Tips!

Si vous voulez cliquer sur le bouton "Charger plus" pour un nombre X de fois, cliquez sur l'icône de paramètres dans la boîte de pagination et cliquez sur "Quitter la boucle", définissez Répétitions sur le nombre X.

 mceclip2.png

  • Après avoir terminé de créer la boucle de pagination avec le bouton "Charger plus", vous pouvez ensuite créer une liste de page à parcourir.

build_a_list.gif

Tips!

Si la boucle d'extraction a été construite à l'intérieur de la boucle de pagination, faites-la glisser manuellement car nous devrions terminer la première boucle pour exécuter la seconde dans Octoparse.

move_loop_item.gif

 

 

Les Articles liés:

"Charger plus" a été configuré mais aucun nouvel élément n'a été ajouté à la liste ?

Régler la pagination (sans bouton "Suivant")

 

Si vous avez des questions, n'hésitez à soumettre une demande ici. Notre équipe d'assistance vous répondra dans les 24 heures.

 

Artículo en español:  Tratar la paginación (con el botón "Cargar más")

También puedes leer artículos de web scraping en sitio web oficial

 

Auteur: Yina

Editeur: Isabel

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter