undefined

Régler la pagination (avec le bouton "Suivant")

Thursday, July 01, 2021 9:15 AM

La pagination est le processus de diviser un document en pages distinctes, numériques ou imprimées. La configuration de la pagination est primordiale pour obtenir d'une grande quantité de données à partir de plusieurs pages. Les moyens courants de pagination incluent la pagination avec le bouton "Suivant", le bouton "Charger plus" ou avec un défilement infini.

Dans ce tutoriel, nous vous introduirons la manière de gérer la pagination avec le bouton "Suivant" dans Octoparse.

 

Il y a deux manières pour configurer la pagination avec le bouton "Suivant" :

1) Utiliser l'algorithme Auto-détection pour configurer la pagination 

2) Configurer la pagination manuellement

 

 

1) Utiliser l'algorithme Auto-détection pour configurer la pagination

Vous auriez besoin d'un URL d'exemple pour suivre: https://www.amazon.com/s?k=sunglass&ref=nb_sb_noss_2

 

1. Cliquez sur "Détecter automatiquement les données de la page Web" dans le panneau Tips.

 mark.png

 

2. Après que le processus d'auto-détection est terminé, vérifiez si l'option "Paginer pour gratter plus de pages" est cochée. (Normalement, cette option s'affichera automatiquement dans le panneau Tips.)

 create_pagination.png

3. Cliquez sur le bouton "Vérifier" pour voir quel bouton est identifié comme le bouton "Suivant".

check-pagination1.png

Si Octoparse n'est pas parvenu à reconnaître le bon bouton de page suivante, cliquez sur "Modifier" pour le sélectionner manuellement.

edit_pagination.gif

 

4. Cliquez sur "Créer un workflow" dans le panneau Tips et un workflow avec une pagination sera ainsi créée immédiatement.

create_workflow.png

 

5. Testez le workflow en cliquant sur "Pagination" et sur "Cliquer pour paginer" pour voir si Octoparse peut passer à la page suivante correctement. Si vous constatez qu'Octoparse est capable d'aller à la page suivante, cela signifie que votre pagination est correctement configurée.

t4.gif

 

Tips!

S'il n'y a pas d'option "Paginer pour gratter plus de pages" dans le panneau Tips après l'accomplissement d'auto-détection automatique, vous pouvez cliquer sur "Créer un workflow", puis l'option affichera sur les Tips.

1.png

 

Sélectionnez le bouton de page suivante sur la page Web et cliquez sur le bouton "Confirmer".

1.gif

 

 

 

2) Configurer la pagination manuellement

1. Cliquez sur le bouton/l'icône de page suivante. Choisissez ensuite "Cliquer en boucle sur chaque URL" dans le panneau Tips.

 nextbutton1.png

2. Après avoir configuré la pagination, cliquez sur la barre "Pagination" puis sur "Cliquer pour paginer" pour vérifier si Octoparse est capable de passer à la page suivante. Si vous constatez qu'Octoparse est capable d'aller à la page suivante, cela signifie que votre pagination est correctement configurée.

t4.gif

Tips!

Lorsqu'il n'y a pas de "Cliquer en boucle sur chaque URL" sur le panneau Tips, vous pouvez sélectionner "Cliquer en boucle sur page suivante" ou "Cliquer en boucle sur chaque élément"

 

Si vous avez besoin d'aide pour votre projet de données, n'hésitez pas à soumettre une demande ici pour contacter notre équipe d'assistance à tout moment !

 

Artículo en español:  Tratar la paginación (con botón "Siguiente")

También puedes leer artículos de web scraping en sitio web oficial

 

Auteur: Fergus

Editeur: Yina

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter