undefined

Retour à la page précédente

Tuesday, July 19, 2022 9:47 AM

Lorsque nous scrapons des informations de sites Web, nous nous attendons le plus souvent à extraire des données non seulement de la page de résultats de recherche (généralement une page de liste), mais aussi de la page de détail de chaque produit. 

Si vous n'êtes pas sûr de savoir comment atteindre cet objectif avec Octoparse, vous pouvez lire ce tutoriel :Scraper les données de la page de résultat et de la page détaillée du produit

 

Cependant, dans certains cas, lorsque la page détaillée ne peut pas être ouverte dans un nouvel onglet, Octoparse ne peut pas retourner à la page de la liste pour récupérer la page détaillée suivante. Si nous ne pouvons pas trouver un bouton "retour à la page précédente" sur les pages de détails, nous sommes obligés de séparer la tâche en deux parties. Sinon, il y aura des duplications vierges après avoir obtenu la première ligne de données.

 

 

duplication

 

 

Ce tutoriel vous montrera comment résoudre ce problème avec la nouvelle fonction "Retour au précédent" d'Octoparse.

Pour suivre ce tutoriel, vous utiliserez l'URL ci-dessous : 

https://epallet.com/product-list/non-food/health-beauty?page=1&ordering=per_oz_delivered_price,delivered_case_price&clickedProductNumber=0

 

 

Remarque:

Si vous voulez vérifier si votre flux de travail fonctionne correctement, veuillez télécharger le fichier OTD pour ce cas au bas de cette page.

 

Supposons que vous ayez déjà mis en place une boucle permettant de cliquer sur la page de détails de la page de liste.

 

listing page

 

 

Pour commencer, vous devez vous assurer que la page actuelle du navigateur d'Octoparse est la page des détails mais pas la page de la liste.

 

page détaillée

 

  • Cliquez sur ajouter pour ajouter une étape dans le flux de travail
  • Sélectionnez Back to Previous Page dans le menu déroulant

page precedente

 

Et une boîte Back to Previous Page sera présentée dans le flux de travail :

 

workflow

Remarque:

Pour vérifier si cette étape fonctionne correctement, vous pouvez simplement cliquer sur la boîte Back to Previous Page, qui vous redirigera automatiquement vers la page de listing. L'option nouvel onglet pour l'élément à cliquer doit être décochée.

 

 

remarque

 

 

Vous trouverez ci-dessous un exemple d'exécution de données du local. Les formats Excel, CSV, HTML et JSON sont disponibles pour l'exportation.

 

exemple donné

 

Si vous rencontrez d'autres problèmes avec cette tâche ou si vous avez une suggestion qui permettrait d'améliorer cette solution pour vous, nous serions ravis de vous entendre. Soumettez une demande ici.

 

 

 

 

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter