Google Play est un bon site Web pour collecter des avis sur les applications mobiles. Les avis aident les utilisateurs à faire un meilleur choix sur l'application à utiliser ou inciter les développeurs à améliorer leurs applications.

Dans ce tutoriel, nous vous montrerons comment scraper les avis des applications de Google Play.

Vous pouvez visiter le "Modèle de Tâche" qui est facile à utiliser sur l'écran d'accueil de l'Octoparse. Tout ce dont vous avez besoin est de saisir plusieurs paramètres et la tâche est prête. Pour plus de détails, veuillez consulter ici: Modèle de Tâcheexternal-link-symbol-1.png

0.png

 

Pour parcourir, vous pouvez utiliser cette URL dans le tutoriel:

https://play.google.com/store/apps/details?id=com.target.ui&hl=en&showAllReviews=true

Nous  collecterons des données telles que le nom d'utilisateur, l'heure de révision et examiner le contenu de chaque page de détails de l'application avec Octoparse.

Le site Web applique un défilement infini associé à un "Afficher plus" pour charger plus d'avis. Après avoir fait défiler la page vers le bas comme 4 fois, un bouton "Afficher plus" révélerait et si nous voulons continuer à charger les critiques, nous devons cliquer sur le bouton, puis faire défiler la page vers le bas 4 fois à nouveau.

 

Voici les principales étapes de ce tutoriel: [Télécharger le fichier de tâche ici]

  1. "Aller à la page Web" - ouvrir la page Web cible
  2. Auto-détecter la page Web - créer un flux de travail 
  3. Cliquer sur le bouton "Afficher plus" en boucle - charger plus d'avis 
  4. Modifier le XPath de la boucle Item1 - localiser précisément le bouton "Afficher plus"
  5. Démarrer l'extraction - exécuter la tâche et obtenir des données
 

 

 

1. "Aller à la page Web" - ouvrir la page Web cible

  • Entrez URL sur la page d'accueil et cliquez sur "Démarrer"

1.png

 

 

2. Auto-détecter la page Web - créer un flux de travail

  • Choisissez "Détecter automatiquement les données de la page Web"
  • Attendez que la détection soit terminée

2_1.gif

    • Vérifiez les champs de données sur L'aperçu des Données, et vous pouvez également supprimer les champs indésirables ou renommer les champs.

1.png

  • Cliquez sur "Modifier" sous l'option "Ajouter un défilement de page" dans le panneau Tips
  • Configurez le temps d'attente entre 4-5 secondes (assurez-vous que le temps est suffisamment long pour que la page charge de nouveaux avis)

2.2.gif

  • Cliquez sur "Créer un workflow" dans le panneau Tips

2.3.png

 

3. Cliquer sur le bouton "Afficher plus" en boucle - charger plus d'avis 

  • Choisissez "Cliquez sur un bouton" Charger plus "dans le panneau Conseils
  • Sélectionnez le bouton "AFFICHER PLUS" sur la page Web

Tips!

Tout d'abord, Nous devons sélectionner le gros bloc du bouton Afficher plus. Si nous sélectionnons le bouton directement, Octoparse peut cliquer dessus au lieu de le sélectionner.

mceclip0.png

  Ensuite, nous cliquons sur la flèche à droite de la dernière balise DIV et choisissons le DIV dans la fenêtre contextuelle.

3.2.png

  • Configurez le nombre de clics en fonction du nombre d'avis dont vous avez besoin
  • Cliquez sur "Confirmer"

3.gif

  • Cliquez sur ouvrir les paramètres de "Cliquez sur un bouton Charger plus"
  • Configurer AJAX Load en 4s

3.4.png

  • Configurer "faire défiler vers le bas de la page", répéter 4 fois et attendre 4 s entre chaque défilement
  • Cliquez sur "OK" pour confirmer

3.5.png

 

 

4. Modifier le XPath de la boucle Item1 - localiser précisément le bouton "Afficher plus"

  • Cliquez pour ouvrir les paramètres de "Loop Item1"
  • Enter the XPath //span[text()='Show More']/..4.2.png

Tips!

If you want to learn more about XPath, please check the following tutorial:

What is XPath and how to use it in Octoparse

 

 

5. Démarrer l'extraction - exécuter la tâche et obtenir des données

  • Cliquez sur "Enregistrer"
  • Cliquez sur "Démarrer" dans le côté supérieur gauche
  • Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud (uniquement pour les utilisateurs premium)

4.1.png

 

Voici l'exemple de production

mceclip0.png