undefined

Réessayer les actions

Monday, July 12, 2021 10:06 AM

L'action Réessayer est une fonctionnalité fournie dans Octoparse pour traiter les erreurs de chargement de page. Vous pouvez choisir parmi des conditions fournies pour faire Octoparse recharger la page Web actuelle. Pour le scraping web, il est essentiel de s'assurer que la page Web est chargée correctement afin qu'Octoparse puisse continuer d'extraire les informations dont vous avez besoin.

 

1. Pourquoi configurer Réessayer ?

Lorsque la page Web n'était pas chargée correctement, Octoparse rencontrait des problèmes pour scraper les données Web cibles et ne pouvait même pas passer à l'action suivante. De ce fait, il est nécessaire de définir une condition de "Réessayer" pour recharger la page Web avant d'extraire les données.

 

2. Comment configurer Réessayer ?

L'option Réessayer ne s'applique qu'à deux opérations liées au chargement de page dans le workflow : 1) Accéder à la Page Web et 2) Cliquer sur un élément/Cliquer pour Paginer.

1) Double-cliquez sur l'action pour accéder aux paramètres. Ensuite, vous pouvez cliquer sur Réessayer pour afficher les options.

mceclip6.png

2) Maintenant, cochez la case "Réessayer l'action quand", puis cliquez sur mceclip0.png pour configurer les conditions de rechargement de page. Vous "dites" ainsi à Octoparse quand recharger la page si une ou plusieurs conditions sont remplies.

mceclip1.png

 

Maintenant, configurez les conditions de Réessayer avec les options fournies.

mceclip2.png

mceclip3.png

Habituellement, lorsque la page ne se charge pas correctement, vous recevrez des messages d'erreur tels que "erreur", "Erreur de Serveur Interne 500" ou "Trop de demandes". Supposons que nous voulions recharger la page lorsqu'une "Erreur de Serveur Interne 500" apparaît sur la page. Dans ce cas, la condition configurée doit être : si la page actuelle contient le texte "Erreur de Serveur Interne 500", rechargez la page. Par conséquent, lorsque la chaîne est trouvée sur la page actuelle, Octoparse réessayera de charger la page.

mceclip4.png

Vous pouvez aussi saisir le XPath d'un élément spécifique, qui ne s'affichera que lorsque la page se charge correctement. Dans ce cas, vous devez choisir l'option Ne pas contenir. Par conséquent, si l'élément saisi n'est pas trouvé sur la page, Octoparse rechargera la page.

 

mceclip5.png

Continuez à cliquer sur mceclip0.png pour ajouter autant de conditions que nécessaire pour satisfaire des exigences de votre projet.

 

3) Configurer Réessayer pour et le Temps d'attente

Après avoir défini les conditions de réessayer, vous pouvez décider de réessayer de charger la page Web une, deux ou plusieurs fois. Le nombre de répétitions est essentiel pour qu'Octoparse ne recharge pas la page Web à l'infini. Lorsque Octoparse atteint le nombre maximum de réessayer il s'arrêtera et passera à l'étape suivante. 

mceclip7.png

 

Si vous avez des questions, vous pouvez soumettre une demande ici. Notre équipe d'assistance vous répondra dans les 24 heures.

 

Artículo en español:  Acción de reintentar

También puedes leer artículos de web scraping en sitio web oficial

 

Auteur: Yina

Editeur: Isabel

 

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter