undefined
Blog > Data Collection > Post

Comment extraire les coordonnées géographiques sur Google Maps ?

Monday, June 06, 2022

Avez-vous déjà pensé que vous pourriez gagner de l'argent en sachant combien de restaurants il y a dans un kilomètre carré ? Il n'y a pas de repas gratuit, cependant, si vous savez comment utiliser Google Maps, vous pouvez extraire et collecter les GPS des restaurants et les stocker dans votre propre base de données. Avec ces informations en main et quelques calculs mathématiques, vous êtes prêt à créer un service en ligne de big data.

 

Dans cet article, je vais vous montrer comment saisir les coordonées géographiques sur Google Maps rapidement, simplement et facilement.

 

Il est important de savoir avant toute chose que les coordonnées géographiques sont en fait cachées dans les URL. Dans ce cas, il nous suffit d'extraire l'URL et puis mettre en service une expression régulière pour obtenir le texte exacte que nous recherchons. Prenons l'exemple le Musée du Louvre. 

 

Sommaire

Où trouver les coordonnées géographiques ?

Comment extraire les coordonnées géographiques ?

 

Où trouver les coordonnées géographiques ?

Premièrement, ouvrez Google Maps dans votre navigateur et tapez Musée du Louvre dans la barre de recherche.

Après le chargement de la page, nous pouvons repérer les coordonnées géographiques dans l'URL. Les coordonnées sont situées derrière le signe «@».

 

 

 

Et maintenant, nous pouvons facilement récupérer les coordonnées en extrayant l'URL. L'outil que nous utilisons est Octoparse. Vous pouvez utiliser l'outil qui vous convient le mieux. J'ai fait ce choix parce que Octoparse, l'emporte sur tous les autres outils de web scraping par son interface utilisateur intuitive et facile, surtout pour les débutants. Il serait préférable que vous l'ayez déjà sur votre ordinateur, ou vous pouvez le télécharger ici.

 

 

Comment extraire les coordonnées géographiques ?
1. Ouvrir Octoparse pour construire une tâche

 

2. Cliquer sur le signe "+" pour entrer dans le " Advanced Mode "

 

3. Entrer l'URL sur Octoparse https://www.google.com/maps/place/Louvre+Museum/@48.8606146,2.3354553,17z/data=!4m5!3m4!1s0x47e671d877937b0f:0xb975fcfa192f84d4!8m2!3d48.8606111!4d2.337644

 

4. Cliquer sur le bouton " save " pour continuer et il est maintenant temps de configurer la tâche.

 

5. Si on cliquer sur le nom de l'endroit, sur le panneau " Action Tips " apparaîtront les options que vous pouvez prendre. Sélectionner " Extract text of selected element ".

 

 

6. Vous devriez maintenant remarquer que l'extraction a été créée avec succès et ajoutée au flux de travail ci-dessous. Nous pouvons modifier le nom du champ à partir de la zone de réglage située dans le coin supérieure droite.

7. Dans le champ d'extraction, cliquer sur le bouton indiqué ici-bas pour faire apparaître le menu déroulant, sélectionner " Page-level data " et choisir " Page URL ".

8. Maintenant, nous avons réusssi à extraire l'URL de la page Web. C'est formidable ! Bien sûr, nous devons modifier le formulaire URL pour couper l'excès et obtenir les coordonnées géographiques exactes.

9. Déplacer le curseur sur le champ de Page_URL, vous verrez trois points. Cliquer desssus et puis sélectionner " Clean data ".

10. Cela vous amène à une liste de fonctions pour le nettoyage des données. Dans ce cas, nous sélectionnons " Match with regular expression ".

11. Vous devriez arriver ici. Cela vous permet de modifier les données comme vous le souhaitez en écrivant une expression régulière. Une expression régulière est une chaîne de texte spéciale permettant de décrire un modèle de recherche. Étant donné que la plupart des gens ont des difficultés à écrire une expression régulière, nous pouvons utiliser l'outil RegEx intégré dans l'Octoparse. Cliquer sur le bouton " Try the RegEx Tool ".

12. Vous devriez arriver ici. Cela vous permet de modifier les données comme vous le souhaitez en écrivant une expression régulière. Une expression régulière est une chaîne de texte spéciale permettant de décrire un modèle de recherche. Étant donné que la plupart des gens ont des difficultés à écrire une expression régulière, nous pouvons utiliser l'outil RegEx intégré dans l'Octoparse. Cliquer sur le bouton " Try the RegEx Tool ".

13. Exécuter la tâche
Voilà, c'est fait ! Vous avez terminé. Il est temps d'exécuter le crawler et de voir s'il fonctionne.

 

Si vous avez des questions sur la mise en place d'un crawler, n'hésitez pas à nous contacter. Octoparse est conçu de manière professionnelle pour vous accompagner tout au long de votre parcours, du débutant à l'expert en web scraping. Nous sommes là pour vous aider à devenir un maître dans l'art du web scraping.
En plus des coordonnées géographiques, l'Octoparse vous permet de récupérer toutes autres données apparues sur Google Maps et de plus, des modèles d'extraction sont accessibles pour vous faciliter le travail. Allez découvrir !

 

 

 

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter