Les magasins en ligne de Web scraping comme eBay ou Amazon sont devenues une source de données extraordinairement importante, qui vous permet de comparer facilement les vente chaude produits à partir des prix, des fonctionnalités et des descriptions de produits. Le Web scraping du commerce électronique occupe une place très important car il vous aide à comparer les vente chaude produits de différentes boutiques en ligne comme eBay et Amazon en fonction de leurs prix, fonctionnalités et descriptions de produits.
Dans ce tutoriel, nous vous montrerons comment scraper les informations de produits d'eBay.
Vous pouvez aller à "Modèle de Tâche" sur l'écran principal de l'outil de scraping Octoparse et commencer directement avec les modèles eBay prêts à l'emploi pour gagner du temps. Avec cette fonctionnalité, il n'est pas nécessaire de configurer les tâches de scraping. Pour plus de détails, veuillez consulter ici: Modèle de Tâche
Scraper des données telles que le nom, l'état, le prix et plus d'informations sur la page de détails du produit en utilisant Octoparse.
URL d'exemple dans ce tutoriel:
Nous allons scraper les informations des produits de "appareil photo numérique" sur eBay.
1. "Aller à la page Web" - ouvrir la page Web cible
Entrez l'URL d'exemple dans la barre de recherche et cliquez sur "Démarrer"
2. Auto-détecter la page Web - créer un flux de travail
Cliquez sur "Auto-detecter les données de page Web" et attendez la termination du processus
Supprimer les champs indésirables ou modifier les noms de champ dans l'aperçu des données
Décochez ''Add a page scroll''
Choisissez "Créer un flux de travail" dans le panneau Tips
Vous aurez un flux de travail comme ci-dessous.
Si toutes les données dont vous avez besoin peuvent être extraites de la page de liste. Si vous souhaitez accéder à chaque page de détail du produit pour obtenir plus d'informations, veuillez suivre les étapes ci-dessous.
3. Sélectionner le lien pour scraper les données sur la page de détail
Choisissez "Cliquez sur le lien pour scraper la page liée"
Choisissez "Title_URL" sur la liste déroulante
Choisissez "Confirmer"
4. Extraire les données sur la page de détail du produit
Choisissez "Détecter automatiquement les données de la page Web"
Double-cliquez sur le nom du champ pour les renommer si nécessaire.
5. Modifier le XPath des champs de données
Vous devriez modifier le XPath de certains champs de données qui ne s'affichent pas sur chaque page de produit, ou la position du champ varie d'une page à l'autre, comme MPN ou UPC. Nous pouvons modifier le XPath pour rendre le scraping des données plus précis. Pas de soucis! Nous avons vous préparé des XPaths fréquemment utilisés. Vous pouvez simplement utiliser l'élément XPath fourni ci-dessous.
Cliquez sur "more"
Cliquez sur "Customize XPath"
Remplacez XPath avec celui révisé
MPN: //td[contains(text(),'MPN')]/following-sibling::td[1]
EAN: //td[contains(text(),'EAN')]/following-sibling::td[1]
UPC: //td[contains(text(),'UPC')]/following-sibling::td[1]
Item Weight: //td[contains(text(),'Item Weight')]/following-sibling::td[1]
Cliquez sur "OK" pour enregistrer
6.Démarrer l'extraction - exécuter la tâche et obtenir des données
Cliquez sur "Enregistrer"
Cliquez sur "Démarrer" dans le côté supérieur gauche
Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud
Voici l'exemple de production