logo
languageFRdown
menu

Yelp scraping pour obtenir les données de commerces de Yelp

8 minutes de lecture

Cet article propose une solution pour scraper rapidement, facilement et gratuitement les données de Yelp sans nécessiter aucune compétence en matière de codage. C’est le bon choix pour ceux qui souhaitent télécharger à grande échelle des données à partir de Yelp (surtout les données des commerces, comme numéro de téléphone, sites Web, avis clients, etc. )

Introduction de Yelp scraping

Quand on aborde le sujet de Yelp scraping, la première chose qui vient en tête est que Yelp se classe en quatrième position parmi la liste des sites les plus scrapés par les utilisateurs d’Octoparse. La plupart d’entre eux essaient de recueillir des données sur les commerces près de chez eux, telles que nom de la société, numéro de téléphone, adresse, horaires d’ouverture. Beaucoup sont ceux qui ont l’intention d’obtenir des avis des clients.

Yelp se confirme comme l’une des sources les plus fiables pour l’extraction de données concernant les commerces locaux comme les restaurants, les magasins, les services à domicile, les services automobiles, etc. Les avis et les recommandations laissées par les utilisateurs sont d’une valeur inestimable.

Yelp, qui est un agrégateur de commerces locaux et plateforme d’évalution des clients, est très utile pour :

☑️ Créer une liste de commerces locaux pour différents secteurs d’activité

☑️ Savoir ce que offrent vos concurrents et comment se comportent-ils

☑️ Faire des recherches sur une certaine industrie

☑️ Analyser les sentiments pour des commerces/marques avec les avis clients

☑️ Comprendre le marché et les clients grâces aux commentaires ou recommendations laissés par les utilisateurs

……

Quelles que soient les données de Yelp que vous souhaitez récupérer, il s’agit d’une tâche épuisante de les obtenir manuellement et cela coûte une grande somme d’argent si on essaie de les acheter sur le marché.

Ne vous inquiétez pas ! Le web scraping est à votre service. Octoparse, outil de web scraping, peut vous aider à récupérer rapidement, facilement et gratuitement une quantité immense de données pour l’exploration ultérieure. Allons donc droit au but :

comment scraper les données de Yelp ?

Scraper les données Yelp en trois étapes avec les modèles d’Octoparse

Dans cette partie, je vais introduire Octoparse, qui est un outil de web scraping spécialement conçu pour les non-codeurs. Et je vais vous montrer comment commencer votre propre Yelp scraper en seulement 5 minutes.

On introduit surtout ci-dessous deux Yelp scrapers pré-construits. Par “scrapers pré-construits”, je veux dire les modèles de web scraping qui sont construits par nos développeurs et qui sont prêts à utiliser sur le logiciel de bureau.

Donc, allez télécharger et puis installer Octoparse, découvrir les modèles de web scraping de Yelp ( il en compte 9) et choisir celui qui convient parfaitement à vos besoins.

Et je vous invite à lancer le logiciel premièrement, et puis suivre les étapes pour scraper rapidement, facilement et gratuitement les données de Yelp. Cet article concentrera sur deux d’entre les Yelp scrapers :

  • 1. Yelp scraper pour obtenir des données par recherche de mots-clés et d’emplacement
  • 2. Yelp scraper pour obtenir des données par URL

 Tips

  • *Voilà un guide de dépannage au cas où vous rencontriez des problèmes pour télécharger ou installer le logiciel.
  • *Si vous sentez confus face à ce logiciel qui semble sophistiqué, voilà un tutoriel de base disponible qui vous aidera à s’en sortir.
  • *Si vous rencontrez des problèmes et avez des doutes, n’hésitez pas à contacter l’équipe de support.

# Scraper les données Yelp par recherche de mots-clés et d’emplcement

Étape 1 : trouver le Yelp scraper en question (intitulé “Yelp Keyword Searche Python”)

Quand vous cliquez sur le modèle, vous verrez une petite introduction de ce modèle expliquant comment l’utiliser (description), quels paramètres à définir (parameters), et quelles données que vous pouvez obtenir (data preview & sample)

Ce n’est pas grave si vous ne voulez pas tout lire. Cliquez simplement sur le petit bouton bleu “Try it” pour commencer à configurer le scraper.

Étape 2 : entrer les paramètres pour configurer le scraper

Maintenant, c’est à vous de dire qu’est-ce que doit faire votre Yelp scraper. Il y a trois champs à remplir ici :

Keywords – Sur quoi sont les données que vous voulez récupérer, par exemple, restaurant

PageSize – Combien de pages de données voulez-vous récupérer ?

Locations – A proximité de quel emplacement, par exemple, Paris

 Faites attentions :

  • 1. Entrer les mots-clés à raison d’un mot par ligne. Vous pouvez entrer jusqu’à dix mots-clés. Ne laissez pas de ligne vide dans la zone de texte, sinon Octoparse va le regarder aussi comme un paramètre
  • 2. Entrer les mots-clés d’emplacement à raison d’un mot par ligne et vous pouvez entrer jusqu’à dix mots-clés
  • 3. Entrer le nombre de pages que vous allez scraper. N’oubliez pas que Yelp montre publiquement 24 pages de données au maximum 

Une fois que ces trois paramètres sont configurés, cliquez sur le bouton “Save & Run” pour lancer le scraper. Voilà ! C’est fait ! Et c’est simple comme bonjour.

Étape 3 : exécuter le scraper et extraire les données quand le scraping est achevé

 Tips :

  • Ce modèle ne marche que dans le Cloud (pour que le web scraping fonctionne bien avec la rotation des IPs dans la fin d’éviter le blockage), vous devriez vous abonner à Octoparse pour avoir accès au service de Cloud

Il suffit aux utilisateurs de cliquer sur le bouton “Save & Run” pour lancer le scraper dans le Cloud avant que le scraper ne travaille assidûment pour vous récupérer les données Yelp.

Sur le “Dashboard” (tableau de tâches), vous pouvez voir toutes les tâches que vous avez construites et vous voyez aussi si la tâche est achevée.

Cliquez dessus pour apercevoir les données qui s’affichent comme suivant :

Vous pouvez exporter les données récupérées vers Excel, CSV, JSON et HTML, ou directement vers votre base de données ou outils de visualisation de données via les API d’Octoparse.

# Scraper les données Yelp par URL

Cette tâche ressemble beaucoup à celui au-dessus puisque les étapes sont presque les mêmes, mais nous allons utiliser un autre modèle. Donc, je vais simplifier l’introduction des étapes.

Étape 1 : trouver le Yelp scraper en question (intitulé “Yelp URLs Python”)

Étape 2 : entrer les paramètres pour configurer le scraper

Étape 3 : exécuter le scraper et extraire les données quand le scraping est achevé

La différence consiste aux paramètres à entrer. Cette fois, entrer les URLs des résultats de recherche dont vous voulez extraire des données. Vous pouvez entrer une ou plusieurs URL en fonction de vos besoins. Par exemple,

https://www.yelp.com/search?find_desc=Restaurants&find_loc=paris

est le URL de la page de résultats de recherche lorsqu’on veut découvrir les restaurants à Paris.

Scraper les données Yelp en créant un scraper par soi-même

Certainement, nombreux sont ceux dont le besoin est plutôt spécifique ou particulier. Et il y a peut-être des gens qui s’amusent à créer des tâches de web scraping par eux-mêmes. Ils peuvent utiliser le mode avancé et essayer la fonction de détection automatique pour construire un scraper plus personnalisé.

Je ne m’attarderai pas sur les étapes de construire un scraper par soi-même puisqu’il y a un vidéo qui explique déjà très clairement comment scraper des données de restaurants sur Yelp.

Le web scraping est fantastique pour saisir des données Web. Allez découvrir !

Articles populaires

Explorer les sujets

Commencer votre découverte de Octoparse dès maintenant

Télécharger

Lecture conseillée