undefined
Blog > Data Collection > Post

Comment extraire les coordonnées sur Google Maps?

Wednesday, September 15, 2021

Avez-vous déjà pensé que vous pourriez gagner de l'argent en sachant combien de restaurants il y a dans un kilomètre carré ? Il n'y a pas de repas gratuit, cependant, si vous savez comment utiliser Google Maps, vous pouvez extraire et collecter les GPS des restaurants et les stocker dans votre propre base de données. Avec ces informations en main et quelques calculs mathématiques, vous êtes prêt à créer un service en ligne de big data.

 

Dans cet article, je vais vous montrer comment extraire rapidement les coordonnées de Google Maps avec une méthode simple et facile.

 

Il est délicat de remarquer que les coordonnées sont en fait cachées dans les URL. Dans ce cas, nous devons extraire l'URL et utiliser une expression régulière pour trouver la chaîne de texte exacte que nous recherchons. Prenons l'exemple du site de la Space Needle à Seattle. 

 

Données de coordonnées de Google Maps

 

 
Tout d'abord, ouvrez Google Maps dans votre navigateur et tapez Space Needle dans la barre de recherche.

Space Needle

Après le chargement de la page, recherchez les coordonnées dans l'URL. Les coordonnées sont situées derrière le signe «@».

coordinates in the URL

 

Ensuite, nous pouvons commencer à extraire l'URL. L'outil que nous utilisons est Octoparse. Vous pouvez utiliser l'outil qui vous convient le mieux. Octoparse est le meilleur outil de scraping web que j'ai jamais rencontré, car son interface utilisateur intuitive est très facile à prendre en main, surtout pour les débutants. Il serait préférable que vous l'ayez déjà sur votre ordinateur, ou vous pouvez le télécharger ici.

 

Ouvrir Octoparse pour construire une tâche 

1. Cliquez sur le signe «+» pour entrer dans le «Advanced Mode»

2. Entrez l'URL sur Octoparse https://www.google.com/maps/place/Space+Needle/@47.6205099,-122.3514661,17z/data=!4m5!3m4!1s0x5490151f4ed5b7f9:0xdb2ba8689ed0920d!8m2!3d47.6205063!4d-122.3492774 

3. Cliquez sur «save» pour continuer. 

 

Configurer la tâche 

Nous avons maintenant créé une nouvelle tâche. Le problème est que Google Maps ne se charge pas correctement dans son navigateur intégré. Pourquoi ? Parce que Google Maps n'est pas compatible avec l'agent utilisateur du navigateur actuel.

  • Pour résoudre ce problème, cliquez sur l'icône. Trouvez l'option User-agent Switcher. Choisissez Firefox 45.0 et cliquez sur «save». Octoparse rechargera la page Web automatiquement. 
  • Une fois le chargement de la page Web terminé, nous pouvons commencer l'extraction en pointant et en cliquant sur le navigateur intégré. Cliquez sur le nom, le panneau «Action Tips» fera apparaître les options que vous pouvez prendre. Sélectionnez «Extract text of selected element» .

space needle click

 

  • Vous devriez maintenant remarquer que l'extraction a été créée avec succès et ajoutée au flux de travail ci-dessous. Nous pouvons modifier le nom du champ à partir de la zone de réglage située dans le coin supérieure droite.

work flow

  • Allez dans le champ d'extraction et trouvez «Add predefined field» en bas. Cliquez pour faire apparaître le menu déroulant, sélectionnez «Add current page information» et choisissez «Web page URL».


web-page-url

 

  • Maintenant, l'URL de la page Web a été ajoutée au champ de données de façon satisfaisante. C'est formidable ! Bien sûr, nous devons modifier le formulaire URL pour couper l'excès et obtenir les coordonnées exactes.
     

advance-editing

 

 

  • Cliquez sur l'icône «Customize» (petit crayon) customize en bas. Sélectionnez «Refine extracted data». Cliquez ensuite sur le bouton add step. Cela vous amène à une liste de fonctions où vous pouvez choisir pour le nettoyage des données. Dans ce cas, nous sélectionnons «Match with regular expression». Vous devriez arriver ici.

 regex

 

  • Cela vous permet de modifier les données comme vous le souhaitez en écrivant une expression régulière. Une expression régulière est une chaîne de texte spéciale permettant de décrire un modèle de recherche. Étant donné que la plupart des gens ont des difficultés à écrire une expression régulière, nous pouvons utiliser l'outil RegEx intégré pour nous aider. Cliquez sur le bouton «Try RegEx Tool».
     

Remarquez que nous voulons extraire la partie après le signe «@» mais avant la deuxième virgule. Cochez la case «Start With», et saisissez «@». Ceci indique au RegEx que vous voulez la partie après le signe. De la même manière, cochez la case «End With» et saisissez «, 1». Comme il y a deux virgules derrière le «@», nous devons définir quelle virgule nous voulons. Il suffit d'ajouter le numéro derrière la virgule, dans ce cas, ajoutez le numéro «1». Cela indique au RegEx que vous voulez la partie avant la virgule et le numéro 1. Cliquez sur le bouton «Generate», l'expression régulière devrait pouvoir s'afficher dans la boîte. 

 

  • Maintenant, il suffit de confirmer que nous avons correctement défini en cliquant sur le bouton «Match». Cela génère l'expression correspondante sur la droite. Boom ! C'est exactement ce que nous voulons. Maintenant, allez-y et cliquez sur «Apply» puis sur «Ok» pour confirmer.

regex2 

 

Exécuter la tâche

Voilà, c'est fait ! Vous avez terminé. Exécutons le crawler et voyons s'il fonctionne. Cliquez sur «Start Extraction» et choisissez «Local Extraction».

 final

Et si vous aviez 1000 adresses à rechercher ? Ne vous inquiétez pas, Octoparse vous permet de saisir plus de 10 000 URL lorsque vous configurez la tâche. C'est aussi simple qu'il n'y paraît.

 

Si vous avez des questions sur la mise en place d'un crawler, n'hésitez pas à contacter support@octoparse.com. Octoparse est conçu de manière professionnelle pour vous accompagner tout au long de votre parcours, du débutant à l'expert en web scraping. Nous sommes là pour vous aider à devenir un maître dans l'art du web scraping.

 

 

Author: Ashley

Ashley est une passionnée de données et une blogueuse passionnée qui possède une expérience pratique en matière de scraping web. Elle s'attache à capturer des données Web et à les analyser de manière à fournir aux entreprises des informations exploitables. Lisez ses blogs ici pour découvrir des conseils pratiques et des applications sur l'extraction de données Web.

 

日本語記事:Googleマップから座標(緯度・経度)を取得する方法ご紹介
Webスクレイピングについての記事は 公式サイトでも読むことができます。
Artículo en español: Cómo extraer las coordenadas de Google Maps
También puede leer artículos de web scraping en el Website Oficial

 

 

 

Téléchargez Octoparse pour démarrer le web scraping ou contactez-nous pour toute autre demande
questions sur le web scraping!

Contactez-Nous Télécharger
Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter