undefined

Scraper les différentes variantes d'un produit

Friday, July 02, 2021 12:31 PM

Si vous avez besoin de récupérer des données de commerce électronique, en particulier les données de produit, vous auriez peut-être les besoins suivant.

Pour certains produits avec différentes options, vous souhaiteriez peut-être collecter le prix de chaque variante, SKU, etc. En prenant ce produit de teinture capillaire comme exemple, vous voudriez peut-être gratter son prix pour chaque couleur.

mceclip0.png

 

Solution:

Pour vous montrer comment le faire avec Octoparse, nous prendrons cette URL de page Web comme exemple: https://www.walmart.com/ip/SoftSheen-Carson-Dark-and-Lovely-Fade-Resist-Rich-Conditioning-Color/10314047

Pour ce produit, la couleur, le prix, les images, l'URL de la page et l'ID du produit varient toujours lorsque vous changez d'option.

mceclip1.png

 

Voici les étapes que vous pouvez suivre pour y parvenir.

1. Entrez les URL du produit pour démarrer une nouvelle tâche

Vous pouvez saisir une liste d'URL si vous avez une liste de produits à surveiller. Pour vous démonstrer, j'entre juste une URL de produit.

mceclip2.png

2. Créez un élément de boucle pour parcourir chaque option de couleur

  • Cliquez sur la 1ère option de couleur dans la liste, puis choisissez "Tout Sélectionner" dans le panneau "Tips".
  • mceclip3.png
  • Ensuite, choisissez "Cliquer en boucle sur chaque élément"
  • mceclip4.png
  • AJAX est détecté sur cette page Web. Vous pouvez modifier le temps d'attente AJAX en fonction de votre Internet local pour que le contenu de la page puisse être chargé complètement. (Savoir plus sur la manipulation d'AJAX)
  • mceclip5.png
  • Double-click "Click Item" inside the "Loop Item" to uncheck "Open in a new tab".Double-cliquez sur "Cliquez sur l'élément" dans l'"Élément de boucle" et décochez l'option "Ouvrir dans un nouvel onglet".
  • mceclip6.png
  • (Facultatif) Double-cliquez sur "élément de boucle" pour changer le "Mode de boucle" de "Liste fixe" à "Liste variable". Ensuite, entrez XPath de l'élément: //DIV[@class="variants__list"]/LABEL/DIV[2].
  • Cette action est importante lorsque vous avez différents produits avec différents nombres de couleurs à gratter.
  • mceclip8.pngmceclip9.png

Savoir plus sur XPath ici: Qu'est-ce que XPath et comment l'utiliser dans Octoparse.

 

3. Extraire les données dont vous avez besoin sur la page

Vous pouvez cliquer sur les éléments de page pour extraire les données dont vous avez besoin et renommer les champs de données si nécessaire.

extract_data.gif

 

Voici un exemple de sortie de données.

mceclip10.png

 

Si vous avez toujours des problèmes avec ce sujet, envoyez un ticket à notre équipe d'assistance! Nous sommes là pour vous aider.

 

Tutorial en español:  Scrapear diferentes variantes de un producto

También puedes leer más tutoriales de web scraping en sitio web oficial

 

Auteur: Vanny

Editeur: Yina

  

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter