undefined
Blog > Avis clients > Post

Comment extraire les notes et les avis clients sur Amazon pour l'analyse des sentiments?

Friday, August 13, 2021

Amazon est l'une des principales entreprises de commerce électronique qui possède des données sur ses clients. Si nous analysons ces données, nous pouvons élaborer une stratégie plus judicieuse pour améliorer notre service et nos revenus. Dans cet article, je vais donc vous montrer comment récupérer les avis et les informations relatives aux produits Amazon, et effectuer une analyse des sentiments sur les commentaires.

 
Comment extraire les avis et les évaluations de produits Amazon ?

De nos jours, presque tous les types de données sur le Web peuvent être récupérés. En sélectionnant certains éléments sur le Web, puis en analysant les informations, vous êtes en mesure d'obtenir les données. Dans le passé, la plupart des gens obtenaient ce type de données en faisant appel à des spécialistes de l'extraction de données sur le Web, ou en écrivant eux-mêmes le code. Cependant, aujourd'hui, n'importe qui peut obtenir ce type de données en utilisant les outils de web scraping.

 

Vous trouverez dans ce billet un exemple simple d'extraction de critiques et de notes dans l'outil de scraping web Octoparse. Ici, je vais extraire les critiques du film Avant Toi.

 

Prenons d'abord quelques mesures pour récupérer les avis sur Amazon.

 

Étape 1. Lancer une nouvelle tâche

Cliquez sur «New Task». Puis complétez les informations.

 amazon-scraping-tutorial-1

 

Étape 2. Ouvrez la page web

Entrez l'URL cible dans le champ de recherche. Octoparse ouvre alors la page web dans le navigateur intégré, tout comme vous ouvrez les pages web dans d'autres navigateurs.

(https://www.amazon.com/Me-Before-You-Emilia-Clarke/product-reviews/B01GIIVF6K/ref=cm_cr_dp_d_show_all_btm?ie=UTF8&reviewerType=avp_only_reviews&sortBy=recent )

 scrape-amazon-reviews-and-ratings-1

 

Étape 3. Loop click pour passer à la page suivante

Naviguez vers le bouton «Next page». Il suffit de cliquer sur le bouton «Next page», puis de choisir «Loop click the element» dans la fenêtres contextuelles.

 scrape-amazon-reviews-and-ratings-2

 

Étape 4. Créez une liste de boucles pour plusieurs sections

Pour traiter la liste des commentaires afin d'extraire les éléments de chaque section, vous devez créer une liste en boucle.

Déplacez votre curseur sur la section dont la mise en page est similaire, où vous souhaitez extraire des données.

Cliquez sur la première section ➜ Créez une liste de sections ayant une mise en page similaire. Cliquez «Create a list of items» (sections avec la mise en page similaire). ➜ «Add current item to the list».

Ensuite, la première section a été ajoutée à la liste ➜ Cliquez «Continue to edit the list».Cliquez sur la deuxième section ➜ Cliquez «Add current item to the list» .

Maintenant, nous obtenons tous les liens avec une mise en page similaire. ➜Puis cliquez «Finish Creating List» ➜ Cliquez «loop».

 

Étape 5. Sélectionnez les données à extraire et renommez les champs de données

Nous allons maintenant commencer par extraire les commentaires et les notations globales du film.
Cliquez sur un des évaluateurs  ➜ Sélectionnez «Extract text».

 scrape-amazon-reviews-and-ratings-4

Suivez les mêmes étapes pour extraire les autres champs de données (notation, commentaire, temps).

scrape-amazon-reviews-and-ratings-5

Renommez les noms des champs si nécessaire.→ Cliquez «Save».

 

Vous avez maintenant terminé de créer une tâche dans Octoparse. Il suffit d'exécuter la tâche dans la machine locale pour récupérer les données.

 scrape-amazon-reviews-and-ratings-7

Si vous êtes intéressé, vous pouvez consulter ces articles/vidéos sur l'extraction des avis sur les produits Amazon pour plus de détails.

 

Analyse des sentiments sur Semantria

 

Maintenant que j'ai obtenu les données, que pouvons-nous en faire? Bien sûr, nous pourrions lire toutes ces commentaires pour voir ce que les autres en pensent, mais cela prendrait beaucoup de temps. C'est pourquoi nous avons besoin de l'analyse des sentiments.

L'analyse des sentiments nous permet d'obtenir le sentiment général d'un texte. Bien que nous puissions nous contenter de regarder les notations en étoiles, celles-ci ne correspondent pas toujours au sentiment des commentaires. Le sentiment est mesuré par trois valeurs différentes : une valeur négative représentant un sentiment négatif, une valeur neutre représentant un sentiment neutre et une valeur positive représentant un sentiment positif.

J'ai utilisé ici l'outil de sentiment Semantria, un plugin pour Excel 2013. Semantria simplifie l'analyse des sentiments et la rend accessible aux non-programmeurs. J'exporte les données extraites vers Excel (voir les résultats ci-dessous).

 sentiment-analysis1

Je n'analyserai que les 100 premières critiques pour vous montrer comment faire une simple analyse de sentiment ici. Voici les résultats :

 sentiment-analysis-2

La colonne «Document Sentiment +/-» me donne le sentiment général de chaque avis, en me disant s'il est positif, négatif ou mixte. La colonne «Document Sentiment» donne les valeurs numériques permettant de déterminer le caractère positif ou négatif de chaque avis.

 

Les informations pourraient être affichées de manière plus conviviale en créant un graphique en colonnes.

 sentiment-analysis-3

En calculant le document de la valeur du sentiment, on constate que les perceptions positives sont de 26,89, ce qui est beaucoup plus élevé que les autres perceptions, alors que la valeur neutre est de 0,54, la valeur mixte de 0,70 et la valeur négative de -1,79. Compte tenu de la notation globale de 4,4 du film Avant Toi, les valeurs des différentes perceptions sont très cohérentes malgré de petites différences.

 

 sentiment-analysis-4

Pour le confirmer, je recherche en outre la valeur du sentiment de phase.

  

Regardons de plus près.

Phrase Sentiment

Phrase Mentions Sentiment +/-

 

Rating

negative

neutral

positive

Sum

2.0

-0.563729823

0.392652005

0.600000024

0.428922

4.0

-14.94552305

6.095596494

15.26827288

6.418346

5.0

-31.15602022

38.07776087

131.7180169

138.6398

Sum

-46.6652731

44.56600937

147.5862898

145.487

Vous pouvez voir ici qu'il y a une grande cohérence entre les notations et le sentiment, bien que l'étoile 5.0 ait la valeur négative la plus élevée. Mais cela peut être dû au nombre total d'étoiles 2.0.

En comparant la distribution de l'évaluation, vous pouvez constater que l'évaluation moyenne par étoile est distribuée autour de 5.0 (sentiment positif), ce qui confirme la grande cohérence entre les étoiles et le sentiment.

 

 

La méthode ci-dessus est évidemment une approche simple, et il existe un certain nombre d'autres méthodes largement connues d'analyse du sentiment, comme l'apprentissage automatique. En outre, cette méthode n'est pas limitée aux critiques de films. Elle pourrait être appliquée à toute une série d'autres scénarios. Et vous pourriez créer une analyse beaucoup plus approfondie.

 

 

Téléchargez Octoparse pour démarrer le web scraping ou contactez-nous pour toute autre demande
questions sur le web scraping!

Contactez-Nous Télécharger
Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter