La génération de leads est l'une des parties les plus importantes de tout processus de vente. Le Yellowpages est une bonne source de données pour les entreprises de tout secteur afin de collecter des prospects. Dans ce tutoriel, nous allons vous montrer comment extraire les prospects de Yellowpages.

 

Pour les Yellowpages, vous pouvez visiter le "Modèle de Tâche" facile à utiliser sur l'écran principal de l'outil de scraping Octoparse. Tout ce dont vous avez besoin est de saisir plusieurs paramètres et la tâche est prête à démarrer. Pour plus de détails, veuillez consulter ici Modèle de Tâcheexternal-link-symbol-1.png

1.png

 

Si vous voulez savoir comment créer une tâche à partir de zéro avec Octoparse, veuillez suivre les étapes ci-dessous. Nous utiliserons l'URL ci-dessous afin de scraper des données telles que le titre, l'adresse, le téléphone, etc.

https://www.yellowpages.com/search?search_terms=Anesthesiologists&geo_location_terms=New+York

 

Voici les principales étapes de ce tutoriel: [Télécharger le fichier de tâche ici ]

  1. "Aller à la page Web" - ouvrir la page Web cible
  2. Auto-détecter la page Web - créer un flux de travail 
  3. Cliquez sur chaque lien de détail pour obtenir plus d'informations
  4. Extraire des données - extraire des données sur les pages de détail
  5. Configurer le temps d'attente - ralentir la vitesse de scraping
  6. Démarrer l'extraction - exécuter la tâche et obtenir des données
 

1) "Aller à la page Web" - ouvrir la page Web cible

  • Entrez URL sur la page d'accueil et cliquez sur "Démarrer"

5151.png

 

 

2) Auto-détecter la page Web - créer un flux de travail 

  • Cliquez sur "Auto-détecter les données de page Web" et attendez la termination du processus

777777.gif 

  • Accédez à "l'Aperçu des données" pour vérifier si le format des données extraites corresponde à vos attentes.
    • Vous pouvez supprimer les champs de données inutiles en cliquant directement sur l'icône mceclip13.png
    • Vous pouvez aussi modifier les noms de champs de données en cliquant directement sur l'icône mceclip14.png

2.png

  • Cliquez sur "Créer un workflow"

2.1.png

 

Si les données dont vous avez besoin peuvent toutes être extraites de la page de liste, vous pouvez simplement passer à Configurer le temps d'attente pour ralentir la vitesse de scraping. Si vous souhaitez cliquer sur chaque lien détaillé pour obtenir plus d'informations, veuillez suivre l'étape suivante.

 

 

 

3. Cliquez sur chaque lien de détail pour obtenir plus d'informations

  • Choisissez "Cliquez sur le(s) lien(s) pour scraper les pages liées" dans le panneau Tips
  • Sélectionnez "Cliquer sur un champ de données extrait" et sélectionnez celui sur lequel vous souhaitez cliquer dans le menu déroulant (vous pouvez confirmer s'il s'agit du lien correct dans l'aperçu des données)
  • Cliquez sur "Confirmer"

269_262562.gif

 

 

 

4. Extraire des données - extraire des données sur les pages de détail

  • Sélectionnez des informations sur la page Web
  • Choisissez "Extraire le texte de l'élément sélectionné"
  • Répétez les étapes ci-dessus pour extraire toutes les données dont vous avez besoin

4.gif

  • Modifiez le nom du champ de données si nécessaire

4.1.png

 

 

5. Configurer le temps d'attente - ralentir la vitesse de scraping

Comme le site de Yellowpages peut bloquer votre adresse IP si vous le scrapez trop, nous devons contrôler la vitesse de récupération.

  • Cliquez pour ouvrir les paramètres d'action de l'action "Extraire les données1"
  • Cochez "Attendre avant l'action"
  • Configurer le temps entre 5s-10s

5.1.gif

 

 

 

6. Démarrer l'extraction - exécuter la tâche et obtenir des données

  • Cliquez sur "Enregistrer"
  • Cliquez sur "Démarrer" dans le côté supérieur gauche
  • Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud (uniquement pour les utilisateurs premium)

561561561561.gif

 

Voici l'exemple de production

mceclip0.png

 

Tutorial en español:  Scrapear leads de Yellowpages

También puedes leer más artículos de web scraping en el sitio web oficial