undefined
Blog > Web Scraping > Post

3 façons utiles pour récupérer les résultats de recherche de Google

Monday, October 31, 2022

Voulez-vous apprendre comment extraire les résultats de recherche de Google et obtenir les données au format Excel ou CSV? Si vous souhaitez surveiller le classement de votre site web sur Google, analyser vos compétiteurs, ou analyser les publicités payantes sur Google, alors récupérer les résultats de recherche est le meilleur façon de commencer.

 

Dans cet article, nous allons apprendre sur 3 façons différentes que vous pouvez utiliser pour extraire les résultats de recherche de Google.

 

 

 

 

 

Scraper les résultats de recherche de Google sans codage

 

Si vous ne souhaitez pas vous occuper du codage, alors Octoparse est un outil parfait que vous pouvez utiliser pour collecter les résultats de recherche de Google. Il s'agit d'un outil de scraper web facile à utiliser qui peut vous aider à extraire des données à partir de sites web. Octoparse rend le processus d'extraction de données sur web plus accessible et plus rapide. Il peut récupérer automatiquement les données de n'importe quelle page et les enregistrer dans un format organisé sans avoir à écrire le moindre code.

 

La version gratuite d'Octoparse peut répondre à la plupart de vos besoins de scraper, mais si vous recherchez des fonctionnalités avancées telles que l'extraction du cloud, le scraper programmé, la rotation IP, les modèles de tâches prédéfinis et quelques autres, vous pouvez demander une version payante ou le service de données. Dans la partie suivante, nous allons prendre la version gratuite comme exemple, vous pouvez regarder la vidéo ou suivre les étapes faciles.

 

Étapes pour extraire les résultats de recherche de Google avec Octoparse

 

Étape 1 : Ouvrez Google dans octoparse et entrez le mot-clé de recherche

Après avoir installé Octoparse sur votre PC, nous allons commencer par entrer l'URL Google dans l'application Octoparse et cliquer sur Démarrer.

 

Après cela, nous cliquerons sur la barre de recherche dans Google et cliquerons sur le bouton "entrer du texte" dans la boîte de conseil. Ensuite, nous entrons le mot-clé de recherche que nous voulons rechercher sur Google.

 

 

entrer url

 

Cliquez ensuite sur le bouton de recherche sur Google et cliquez sur "Bouton de clic" dans la boîte de conseils. Cela cliquera sur le bouton Rechercher et nous serons envoyés à la page des résultats de recherche de Google.

 

entrer mot clé

 

 

 

Étape 2 : Sélectionnez les données que vous devez extraire

Lorsque nous arrivons à la page de résultats de recherche, nous cliquons sur les données que nous devons extraire. Par exemple, si nous voulons extraire le titre du résultat de la recherche, cliquez sur le premier et le deuxième titre et il sélectionnera automatiquement tous les autres titres.

 

Cliquez ensuite sur "Extraire le texte de l'élément sélectionné" et le scraper est prêt à récupérer tous les titres du résultat de la recherche.

 

autodétection

 

 

Si vous avez besoin de plus d’informations sur le scraper des résultats de recherche de Google avec Octoparse et que vous devez extraire d’autres données telles que l’URL du site, le titre, la méta-description et d’autres détails, ou si vous souhaitez paginer vers les pages suivantes des résultats de recherche de Google, vous pouvez consulter le guide de scraper des résultats de recherche de Google.

 

Étape 3 : Exécutez et exportez les résultats de recherche de Google récupérés

Cliquez sur le bouton "Exécuter" en haut pour lancer le processus de scraper. Sélectionnez si vous souhaitez exécuter le scraper sur votre appareil ou sur le cloud. Une fois l'exécution terminée, vous pouvez cliquer sur le bouton "Exporter les données" et exporter les données de résultats de recherche de Google récupérées dans différents formats tels qu'Excel, HTML, CSV ou JSON.

 

 

 

 

 

Récupérer les résultats de recherche de Google avec Python

 

Si vous avez une certaine expérience en programmation et que vous êtes à l'aise avec le codage, vous pouvez utiliser Python avec la Beautiful Soup Library pour collecter les résultats de la recherche. Pour utiliser cette méthode pour scraper les résultats de recherche de Google, vous devrez d'abord installer le langage Python sur votre ordinateur. Si vous avez besoin d'aide pour installer Python sur votre PC, vous pouvez consulter ce tutoriel sur l'installation de Python.

 

Une fois Python installé, vous devrez installer deux modules, bs4 et requests. bs4 (Beautiful Soup) est une bibliothèque python utilisée pour lire des données XML et HTML à partir du web. La requête est un module qui permet d'envoyer des requêtes HTTP au site web. Vous pouvez installer les deux modules avec la commande suivante dans votre terminal ou invite de commande.

 

pip install bs4

pip install requests

 

Une fois les modules bs4 et requests installés, vous pouvez utiliser le code suivant pour extraire les résultats.

 

 

 

# Import the beautifulsoup and request libraries of python.

import requests

import bs4

 

# Make two strings with default google search URL

# 'https://google.com/search?q=' and

# our customized search keyword.

# Concatenate them

text= "web scraping"

url = 'https://google.com/search?q=' + text

 

# Fetch the URL data using requests.get(url),

# store it in a variable, request_result.

request_result=requests.get( url )

 

# Creating soup from the fetched request

soup = bs4.BeautifulSoup(request_result.text,

                         "html.parser")

 

# soup.find.all( h3 ) to grab

# all major headings of our search result,

heading_object=soup.find_all( 'h3' )

 

# Iterate through the object

# and print it as a string.

for info in heading_object:

    print(info.getText())

print("------")

 

 

 

Vous pouvez ensuite changer la valeur de la variable de texte dans le code ci-dessus en le mot-clé de recherche souhaité.

Par exemple, remplacez text='web scraper' par text='octoparse'.

Ensuite, l’exécution de ce script python vous donnera la sortie de tous les résultats dans le résultat de la recherche.

 

 

 

 

Existe-t-il une API pour les résultats de recherche de Google ?

 

La troisième méthode pour récupérer les résultats de recherche consiste à utiliser les outils de l'API de résultats de recherche. Les outils API sont des applications logicielles qui sont créées pour vous aider à extraire les résultats des résultats de recherche en temps réel. Ils peuvent gérer un énorme volume de demandes, et les réponses peuvent être structurées au format JSON, HTML ou CSV.

 

Ces outils API peuvent gérer les proxys, résoudre les captchas et analyser toutes sortes de riches données structurées à partir des recherches de Google. Ensuite, vous pouvez obtenir des données avec tous les détails tels que le titre, le lien, la description, la date et la position SERP.

 

Certaines des API de résultats de recherche les plus populaires sont:

 

  • SERP API
  • Zen SERP
  • ALL SERP
  • SERP House
  • Data for SEO SERP

 

En utilisant les 3 façons ci-dessus, nous pouvons facilement récupérer la page de résultats de recherche de Google. Si vous ne voulez pas traiter avec des codes, utiliser ensuite Octoparse pour scraper les résultats de recherche de Google est la meilleur façons d’obtenir les données des résultats de recherche dans un format structuré. Si vous voulez essayer Octoparse ou si vous avez des questions sur la configuration du scraper, vous pouvez contacter l’équipe de support Octoparse.

 

 

 

 

Lectures conseillées

Scraper CoinGecko pour extraire le prix de cryptomonnaie

Les 15 langages de programmation les mieux payés en 2022

Email permutator : les meilleurs moyens pour trouver l'email de n'importe qui

 

Téléchargez Octoparse pour démarrer le web scraping ou contactez-nous pour des autres
questions sur le web scraping !

Contactez-Nous Télécharger
Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter