Scraper les informations sur les produits de Cdiscount
Monday, August 08, 2022 10:46 AM
Vous êtes en train de consulter un guide de tutoriel pour la dernière version d'Octoparse. Si vous utilisez une version plus ancienne d'Octoparse, nous vous recommandons de la mettre à jour car elle est plus rapide, plus facile et plus robuste ! Téléchargez et mettez à jour ici si vous ne l'avez pas encore fait !
Cdiscount classé dans le top 3 des plateformes de e-commerce international en France, elle se spécialise dans la grande distribution et propose une large gamme de produits : high-tech, mode, électroménager, mobilier, livres… Pour les commerçants sur le marché français, outre Amazon, la plateforme Cdiscount est le premier choix pour la vente en ligne transfrontalière.
Par le biais des données du site web,vous la mettre au service de votre business.Dans ce cas, nous allons récupérer des données telles que l'URL de produit, le titre du produit, le prix et d'autres informations sur Cdiscount en utilisant Octoparse.
Pour suivre le tutoriel, veuillez utiliser l'URL suivante comme référence :
https://www.cdiscount.com/search/10/iphone.html#_his_
Vous trouverez ci-dessous les principales étapes de ce tutoriel :
1.Entrez l'URL de la page d'accueil - pour ouvrir le site Web cible
2.Lancer l'auto-détection - pour créer un flux de travail
3.Modifier XPath - pour extraire les éléments complets
4.Exécutez la tâche - pour obtenir vos données souhaités
1.Entrez l'URL de la page d'accueil - pour ouvrir le site Web cible
Entrez l'URL dans le champ de recherche situé au centre de l'écran d'accueil. Cliquez sur Start pour créer une nouvelle tâche.
2.Lancer l'auto-détection - pour créer un flux de travail
La fonction de détection automatique d'Octoparse peut identifier la structure de la page et générer automatiquement un flux de travail.
- Cliquez sur Auto-detect web page data dans la boîte de conseils et attendez que la détection soit terminée
- Vérifiez les champs de données dans l'aperçu des données et supprimez les données indésirables ou renommez-les en double cliquant si nécessaire
- Cliquez sur Create workflow
Le flux de travail est alors créé comme ci-dessous :
3.Modifier XPath - pour extraire les éléments complets
Pour que la pagination se déroule correctement, un Xpath précis est essentiel.
- Cliquez sur Pagination
- Entrez le Xpath modifié dans Matching XPath :
prix://div[@class='prdtBILPrice']/span[1]
description://div[@class='prdtBILDetails']//div[@class='prdtBILDesc jsPrdtBILLink']/ul
4.Exécutez la tâche - pour obtenir vos données souhaités
- Cliquez d'abord sur le bouton "Enregistrer" pour sauvegarder tous les paramètres que vous avez créés
- Cliquez ensuite sur Run pour exécuter votre tâche, localement ou dans le Cloud
- Sélectionnez Run on your device et cliquez sur Run Now pour exécuter la tâche sur votre appareil local
- Attendre que la tâche soit terminée
Vous trouverez ci-dessous un exemple de données extraites de l'exécution locale. Les formats Excel, CSV, HTML et JSON sont disponibles pour l'exportation.
Scraper les informations de produits d'eBay
Scraper des informations sur les offres d'emploi de Indeed
Scraper les informations sur leboncoin
Scraper les offres d'emploi de Linkedin
1. Youtube
2. Twitter
3. Linkedin