Instruction conditionnelle

Ce tutoriel va vous introduire comment "Instructions conditionnelles" fonctionne.

Mis à jour il y a plus d’une semaine

Toutes les pages ne sont pas créées de la même façon. Lorsque les pages Web présentent des variations, vous pouvez utiliser des "Instructions conditionnelles" pour effectuer un grattage basé sur les conditions. Voici comment cela fonctionne :

Quand devriez-vous envisager d'utiliser les "Instruction conditionnelle" ?

Il existe deux principaux scénarios dans lesquels les "Instructions conditionnelles" peuvent être utiles.

  • Lorsque vous souhaitez uniquement obtenir des données de certaines pages avec une balise spécifique, telles que "Nouveau", "Vente chaude", "En vente", etc.

  • Lorsque les données de la page sont affichées sous différentes formes, c'est-à-dire qu'elles apparaissent parfois sous forme de texte, et parfois sous forme d'images.

Dans l'image d'exemple ci-dessous, nous avons besoin d'informations des ordinateurs portables vendus. Observons la page de détail du produit, il semble que nous pouvons utiliser l'icône "en vente"

Voyons comment c'est fait ! Pour poursuivre, vous pouvez utiliser cette URL:

  • Créez une boucle pour cliquer sur chaque lien de la liste

  • Utilisez des "Instructions conditionnelles" pour tester la condition : si l'icône

est présente sur la page de l'article

Tips!

Si l'écriture de XPath est trop difficile pour vous, vous pouvez cliquer sur et sélectionner l'élément à partir de la page Web. Octoparse générerait automatiquement un XPath.

  • Cliquez sur "OK"

  • Cliquez sur la branche à droite, sélectionnez "Toujours exécuter la branche"

  • Cliquez sur "OK"

Tips!

Dans Octoparse, vous pouvez configurer la condition sur l'un des éléments suivants:

1. Toujours exécuter la branche

Lorsque cette option est sélectionnée, Octoparse ne jugera rien et lancera immédiatement l'exécution des actions au sein de la branche. Sélectionnez cette option uniquement pour la branche sur le côté droit.

2. Exécuter si la page contient un texte spécifique

Lorsque cette option est sélectionnée, Octoparse recherchera la chaîne de texte désignée dans la page actuelle.

3. Exécuter si la page actuelle contient un élément spécifique

When selected, Octoparse will look for the designated element (according to the XPath filled in) within the current page.

4. Exécuter si la boucle actuelle contient un texte spécifique

Lorsque cette option est sélectionnée, Octoparse recherchera la chaîne de texte désignée dans l'élément de boucle actuel.

5. Exécuter si la boucle actuelle contient un élément spécifique

Lorsque cette option est sélectionnée, Octoparse recherchera l'élément désigné (selon le XPath Relatif saisi) dans l'élément de boucle actuel. Utilisez cette option uniquement lorsque vous avez besoin de juger entre les éléments d'une boucle.

  • Sur la page de l'article du produit (sélectionnez un article de la boucle qui contient l'élément

Tips!

1. Si la condition est définie comme "si un élément est trouvé", l'élément désigné doit être trouvé de manière unique sur la page ou le jugement ne fonctionnera pas.

2. Octoparse parcourt les branches de gauche à droite par défaut. Il est important de toujours conserver la condition que vous souhaitez tester dans la branche gauche ; si la condition pour la branche de gauche est "Toujours exécuter la branche", Octoparse ne passera pas à la branche de droite car "Toujours exécuter la branche" sera toujours testé "Vrai".

3. Vous pouvez laisser la branche vide si aucune action d'extraction n'est nécessaire lorsque la condition n'est pas remplie.

4. Lorsqu'une action d'extraction de données est ajoutée aux deux branches, le nombre de champs de données et le nom des champs de données doivent être les mêmes.

5. Vous pouvez utiliser le jugement de branche imbriqué pour affiner davantage le test.

Avez-vous trouvé la réponse à votre question ?