Toutes les collections
Tutoriel sur les cas
E-Commerce
Scraper les informations de produits d'eBay
Scraper les informations de produits d'eBay

eBay scraping: scraper les informations sur les produits, y compris la marque, MPN, le prix etc.

Mis à jour il y a plus d’une semaine

Les magasins en ligne de Web scraping comme eBay ou Amazon sont devenues une source de données extraordinairement importante, qui vous permet de comparer facilement les vente chaude produits à partir des prix, des fonctionnalités et des descriptions de produits. Le Web scraping du commerce électronique occupe une place très important car il vous aide à comparer les vente chaude produits de différentes boutiques en ligne comme eBay et Amazon en fonction de leurs prix, fonctionnalités et descriptions de produits.

Dans ce tutoriel, nous vous montrerons comment scraper les informations de produits d'eBay.

Vous pouvez aller à "Modèle de Tâche" sur l'écran principal de l'outil de scraping Octoparse et commencer directement avec les modèles eBay prêts à l'emploi pour gagner du temps. Avec cette fonctionnalité, il n'est pas nécessaire de configurer les tâches de scraping. Pour plus de détails, veuillez consulter ici: Modèle de Tâche

modèle

Scraper des données telles que le nom, l'état, le prix et plus d'informations sur la page de détails du produit en utilisant Octoparse.

URL d'exemple dans ce tutoriel:

Nous allons scraper les informations des produits de "appareil photo numérique" sur eBay.


1. "Aller à la page Web" - ouvrir la page Web cible

  • Entrez l'URL d'exemple dans la barre de recherche et cliquez sur "Démarrer"

url

2. Auto-détecter la page Web - créer un flux de travail

  • Cliquez sur "Auto-detecter les données de page Web" et attendez la termination du processus

Auto-detecter
  • Supprimer les champs indésirables ou modifier les noms de champ dans l'aperçu des données

modifier

  • Décochez ''Add a page scroll''

  • Choisissez "Créer un flux de travail" dans le panneau Tips

page roll

Vous aurez un flux de travail comme ci-dessous.

workflow

Si toutes les données dont vous avez besoin peuvent être extraites de la page de liste. Si vous souhaitez accéder à chaque page de détail du produit pour obtenir plus d'informations, veuillez suivre les étapes ci-dessous.

3. Sélectionner le lien pour scraper les données sur la page de détail

  • Choisissez "Cliquez sur le lien pour scraper la page liée"

  • Choisissez "Title_URL" sur la liste déroulante

  • Choisissez "Confirmer"

gif

4. Extraire les données sur la page de détail du produit

  • Choisissez "Détecter automatiquement les données de la page Web"

Extraire les données
  • Double-cliquez sur le nom du champ pour les renommer si nécessaire.

double cliquez

5. Modifier le XPath des champs de données

Vous devriez modifier le XPath de certains champs de données qui ne s'affichent pas sur chaque page de produit, ou la position du champ varie d'une page à l'autre, comme MPN ou UPC. Nous pouvons modifier le XPath pour rendre le scraping des données plus précis. Pas de soucis! Nous avons vous préparé des XPaths fréquemment utilisés. Vous pouvez simplement utiliser l'élément XPath fourni ci-dessous.

  • Cliquez sur "more"

  • Cliquez sur "Customize XPath"

Customize XPath
  • Remplacez XPath avec celui révisé

  • MPN: //td[contains(text(),'MPN')]/following-sibling::td[1]

    1. EAN: //td[contains(text(),'EAN')]/following-sibling::td[1]

    2. UPC: //td[contains(text(),'UPC')]/following-sibling::td[1]

    3. Item Weight: //td[contains(text(),'Item Weight')]/following-sibling::td[1]

  • Cliquez sur "OK" pour enregistrer

enregistrer

6.Démarrer l'extraction - exécuter la tâche et obtenir des données

  • Cliquez sur "Enregistrer"

  • Cliquez sur "Démarrer" dans le côté supérieur gauche

  • Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud

exécuter la tâche

Voici l'exemple de production

données exemple

Avez-vous trouvé la réponse à votre question ?