Indeed est l'un des sites Web de publication qui offre les emploi les plus populaires. Vous pouvez découvrir la valeur de tonnes d'informations sur les tâches avec le Web scraping. Dans ce tutoriel, nous allons vous montrer comment utiliser Octoparse pour scraper les offres d'emploi sur Indeed.com.

Avant de commencer, nous devons obtenir l'URL de la page de résultats cible en recherchant un mot-clé et un emplacement.

Voici la démonstration d'un exemple d'URL :

https://www.indeed.com/jobs?q=devops&l=Dallas-Fort%20Worth%2C%20TX&radius=50

 

La façons le plus simple de scraper le site Web est d'aller à "Modèles de Tâches" sur l'écran principal de l'outil de scraping Octoparse et de commencer directement avec les modèles Indeed prêts à l'emploi pour gagner du temps. Entrez simplement l'URL dans le modèle et vous pouvez attendre la sortie des données. Pour plus de détails, veuillez consulter ici: Modèles de Tâches

1.png

 

Si vousvoulez créer la tâche à partir de zéro,vous pouvez utiliser l'URL de ce tutoriel

Voici les principales étapes de ce tutoriel: [Télécharger le fichier de tâche iciexternal-link-symbol-1.png ]

  1. "Aller à la page Web" - ouvrir la page Web cible
  2. Auto-détecter la page Web - créer un flux de travail 
  3. Configurer le temps d'attente pour "Extraire les données" - contrôler la vitesse de scraping
  4. Enregistrer et commencer à exécuter la tâche pour obtenir des données
 

 

1) "Aller à la page Web" - ouvrir la page Web cible

  • Entrez URL sur la page d'accueil et cliquez sur "Démarrer"1.1.png
 

 

2) Auto-détecter la page Web - créer un flux de travail

  • Cliquez sur "Auto-détecter les données de page Web" et attendez la termination du processus

2.gif

 

  • Accédez à "l'Aperçu des données" pour vérifier si le format des données extraites corresponde à vos attentes.
    • Vous pouvez supprimer les champs de données inutiles en cliquant directement sur l'icône. mceclip13.png
    • Vous pouvez aussi modifier les noms de champs de données en cliquant directement sur l'icône.mceclip14.png

2.1.png

  • Cliquez sur "Créer un workflow"

2.2.png

 

 

3) Configurer le temps d'attente pour "Extraire les données" - contrôler la vitesse de scraping

  • Ouvrez les paramètres de l'action "Extraire les données" 
  • Cochez "Wati avant l'action"
  • Configurer le temps d'attente entre 1 - 2 s

3.gif

 

 

4) Enregistrer et commencer à exécuter la tâche pour obtenir des données

  • Cliquez sur "Enregistrer"
  • Cliquez sur "Démarrer" dans le côté supérieur gauche
  • Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud (uniquement pour les utilisateurs premium)

4.png

 

Voici l'exemple de production

mceclip2.png

 

 

 

Auteur: Fergus