undefined

Scraper les informations d'hôtels de Trip.com

Monday, May 17, 2021 5:51 PM

Dans ce tutoriel, nous vous montrerons comment scraper les informations d'hotels de Realtor.com avec Octoparse.

Nous allons scraper des données tels que le nom, la location, la distance, le prix et le classement d'hôtels sur la page de liste avec Octoparse.

Pour continuer, vous auriez besoin d'utiliser URL dans le tutoriel:

https://www.trip.com/hotels/List?city=58&checkin=07-04-2019&checkout=07-05-2019&hotelname=&searchboxArg=t&optionId=58&optionType=Js_City&display=Hong%20Kong&markland=&adult=1&children=0&ages=&label=BWX_hfD1GketyZWr7yv7Yg

 

Ce site Web applique un défilement infini combiné avec "Afficher plus" pour charger plus d'avis. Après avoir fait défiler la page vers le bas près de 2 fois, le bouton "Afficher plus" apparaîtra et vous devons continuer à cliquer sur ce bouton si vous voulez continuer à charger plus d'avis.

Voici les principales étapes de ce tutoriel: [Télécharger le fichier de tâche ici]

  1. Aller à la page Web - ouvrir la page Web cible
  2. Auto-détecter la page Web - créer un flux de travail de base
  3. "Afficher plus" - cliquer sur le bouton"Afficher plus" pour charger plus d'informations d'hôtels
  4. Exécuter la tâche pour obtenir les données dont vous avez besoin
 

 

1. Aller à la page Web - ouvrir la page Web cible

  • Entrez l'URL sur la page d'accueil et cliquez sur "Démarrer"

mceclip0.png

 

 

2. Auto-détecter la page Web - créer un flux de travail de base

Vous pouvez continuer avec la fonction "Auto-détecter les données de la page Web" dans le panneau Tips.

  • Cliquez sur "Auto-detecter les données de la page Web"
  • Attendez que l'auto-détection soit terminée (cela peut prendre un peu plus de temps car cette page applique un défilement infini pour charger des données)

            kkww11.gif              

  • Cliquez sur "Modifier" sous "Ajouter un défilement de page" et définissez le temps d'attente entre 5-7s

2.png

 

  • Accédez à "l'Aperçu des données" pour vérifier si le format des données extraites corresponde à vos attentes.
  • Vous pouvez supprimer les champs de données inutiles en cliquant directement sur l'icône mceclip13.png
  • Vous pouvez aussi modifier les noms de champs de données en cliquant directement sur l'icône mceclip14.png

exo.gif

  • Si vous êtes content de formats actuel de données dans l'aperçu, cliquez sur "Créer un workflow"

2.1.png

 Tips!

Le défilement de pages a été largement appliqué sur de nombreux sites Web. Pour scraper ce type de site Web, vous pouvez soit utiliser la fonction "Auto-Détection"pour vous aider ou configurer par vous-même un défilement de page en double-cliquant sur l'étape "Accéder à la page Web" dans le flux de travail.

Consulter plus de détails dans les tutoriels suivants:

 

 

3. "Afficher plus" - cliquer sur le bouton"afficher plus" pour charger plus d'informations d'hôtels

  • Sélectionnez "Cliquez sur le bouton 'Charger plus' " dans le panneau Tips.
  • Choisissez "Rechercher plus d'hôtels" sur la page Web
  • Configurez le "Nombre de clics"en fonction de vos besoins. Ici, nous le définissons à 5.
  • Prolonger le délai d'attente d'AJAX à 7 s

4.gif

 

 

4.  Exécuter la tâche pour obtenir les données dont vous avez besoin

  • Cliquez sur le bouton "Enregistrer" 
  • Cliquez sur le bouton "Exécuter", puis choisissez "Exécuter la tâche sur votre appareil" ou "Exécuter la tâche sur le cloud"

4.png

Voici un exemple de données pour votre référence.

mceclip1.png


Auteur: Lesley 

Editeur: Yina

 

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter