Retour à la page précédente
Tuesday, July 19, 2022 9:47 AMLorsque nous scrapons des informations de sites Web, nous nous attendons le plus souvent à extraire des données non seulement de la page de résultats de recherche (généralement une page de liste), mais aussi de la page de détail de chaque produit.
Si vous n'êtes pas sûr de savoir comment atteindre cet objectif avec Octoparse, vous pouvez lire ce tutoriel :Scraper les données de la page de résultat et de la page détaillée du produit
Cependant, dans certains cas, lorsque la page détaillée ne peut pas être ouverte dans un nouvel onglet, Octoparse ne peut pas retourner à la page de la liste pour récupérer la page détaillée suivante. Si nous ne pouvons pas trouver un bouton "retour à la page précédente" sur les pages de détails, nous sommes obligés de séparer la tâche en deux parties. Sinon, il y aura des duplications vierges après avoir obtenu la première ligne de données.
Ce tutoriel vous montrera comment résoudre ce problème avec la nouvelle fonction "Retour au précédent" d'Octoparse.
Pour suivre ce tutoriel, vous utiliserez l'URL ci-dessous :
Remarque:
Si vous voulez vérifier si votre flux de travail fonctionne correctement, veuillez télécharger le fichier OTD pour ce cas au bas de cette page.
Supposons que vous ayez déjà mis en place une boucle permettant de cliquer sur la page de détails de la page de liste.
Pour commencer, vous devez vous assurer que la page actuelle du navigateur d'Octoparse est la page des détails mais pas la page de la liste.
- Cliquez sur
pour ajouter une étape dans le flux de travail
- Sélectionnez Back to Previous Page dans le menu déroulant
Et une boîte Back to Previous Page sera présentée dans le flux de travail :
Remarque:
Pour vérifier si cette étape fonctionne correctement, vous pouvez simplement cliquer sur la boîte Back to Previous Page, qui vous redirigera automatiquement vers la page de listing. L'option nouvel onglet pour l'élément à cliquer doit être décochée.
Vous trouverez ci-dessous un exemple d'exécution de données du local. Les formats Excel, CSV, HTML et JSON sont disponibles pour l'exportation.
Si vous rencontrez d'autres problèmes avec cette tâche ou si vous avez une suggestion qui permettrait d'améliorer cette solution pour vous, nous serions ravis de vous entendre. Soumettez une demande ici.