undefined

Scraper les informations sur les produits de Cdiscount

Monday, August 08, 2022 10:46 AM

 

Vous êtes en train de consulter un guide de tutoriel pour la dernière version d'Octoparse. Si vous utilisez une version plus ancienne d'Octoparse, nous vous recommandons de la mettre à jour car elle est plus rapide, plus facile et plus robuste !  Téléchargez et mettez à jour ici si vous ne l'avez pas encore fait !

 

Cdiscount classé dans le top 3 des plateformes de e-commerce international en France, elle se spécialise dans la grande distribution et propose une large gamme de produits : high-tech, mode, électroménager, mobilier, livres… Pour les commerçants sur le marché français, outre Amazon, la plateforme Cdiscount est le premier choix pour la vente en ligne transfrontalière.

Par le biais des données du site web,vous la mettre au service de votre business.Dans ce cas, nous allons récupérer des données telles que l'URL de produit, le titre du produit, le prix et d'autres informations sur Cdiscount en utilisant Octoparse.

 

cdiscount

 

 

Pour suivre le tutoriel, veuillez utiliser l'URL suivante comme référence :

https://www.cdiscount.com/search/10/iphone.html#_his_

 

Vous trouverez ci-dessous les principales étapes de ce tutoriel :  

1.Entrez l'URL de la page d'accueil - pour ouvrir le site Web cible

2.Lancer l'auto-détection - pour créer un flux de travail

3.Modifier XPath  - pour extraire les éléments complets

4.Exécutez la tâche - pour obtenir vos données souhaités

 

 

1.Entrez l'URL de la page d'accueil - pour ouvrir le site Web cible

 

 Entrez l'URL dans le champ de recherche situé au centre de l'écran d'accueil. Cliquez sur Start pour créer une nouvelle tâche.

entrer url

 

 

2.Lancer l'auto-détection - pour créer un flux de travail

La fonction de détection automatique d'Octoparse peut identifier la structure de la page et générer automatiquement un flux de travail.

  • Cliquez sur Auto-detect web page data dans la boîte de conseils et attendez que la détection soit terminée

 

auto détection

 

 

 

  • Vérifiez les champs de données dans l'aperçu des données et supprimez les données indésirables ou renommez-les en double cliquant si nécessaire

 

 

 double cliquer

 

  • Cliquez sur Create workflow

 

créer workflow

 

 

Le flux de travail est alors créé comme ci-dessous :

 

workflow

 

 

3.Modifier XPath  - pour extraire les éléments complets

Pour que la pagination se déroule correctement, un Xpath précis est essentiel. 

  • Cliquez sur Pagination 
  • Entrez le Xpath modifié dans Matching XPath : 

prix://div[@class='prdtBILPrice']/span[1]

xpath de prix


description://div[@class='prdtBILDetails']//div[@class='prdtBILDesc jsPrdtBILLink']/ul

 xpath de la description

 

 

4.Exécutez la tâche - pour obtenir vos données souhaités

  • Cliquez d'abord sur le bouton "Enregistrer" pour sauvegarder tous les paramètres que vous avez créés
  • Cliquez ensuite sur Run pour exécuter votre tâche, localement ou dans le Cloud

 

 

 lancer la tâche

 

 

  • Sélectionnez Run on your device et cliquez sur Run Now pour exécuter la tâche sur votre appareil local
  • Attendre que la tâche soit terminée

 

exécuter dans local

 

 

Vous trouverez ci-dessous un exemple de données extraites de l'exécution locale. Les formats Excel, CSV, HTML et JSON sont disponibles pour l'exportation.

 

données

 

 

Vous avez encore des questions ou avez besoin d'échanger ? N'hésitez pas à me contacter par mail pour que je puisse vous aider. Nos équipes sont à votre écoute pour faire en sorte que notre produit soit celui dont vous avez besoin pour votre métier.

 

 

 

Autres tutoriels:

Scraper les informations de produits d'eBay

Scraper des informations sur les offres d'emploi de Indeed

Scraper les informations sur leboncoin

Scraper les offres d'emploi de Linkedin

 

 

 

 

DECOUVRIR PLUS DE FONCTIONALITE SUR LES RÉSEAUX SOCIAUX !

1. Youtube

2. Twitter

3. Linkedin

 

 

 

 

 

 

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter