La cyber-monnaie est une monnaie numérique ou virtuelle sécurisée par cryptographie, Il est donc presque impossible de simuler ou de réutiliser la consommation. De nombreuses crypto-monnaies sont des réseaux décentralisés basés sur la technologie blockchain - un registre distribué mis en œuvre par un réseau disparate d'ordinateurs.

Les joueurs de cyber-monnaie ont besoin de surveiller la fluctuation des prix sur les devises à mesure que le prix change en quelques secondes. Octoparse peut programmer le scraping pour qu'il s'exécute instantanément pour aider à mettre à jour les informations à temps.

 

Dans ce tutoriel, nous vous montrerons comment scraper les informations sur les cyber-monnaies sur Yahoo Finance

Pour Yahoo Finance, vous pouvez visiter le "Modèle de Tâche" facile à utiliser sur l'écran principal de l'outil de scraping Octoparse. Tout ce dont vous avez besoin est de saisir plusieurs paramètres et la tâche est prête. Pour plus de détails,veuillez consulter ici: Modèle de Tâcheexternal-link-symbol-1.png

 

Pour continuer, vous auriez besoin d'utiliser URL dans ce tutoriel:

https://finance.yahoo.com/cryptocurrencies?count=50&offset=0


Nous extrairons des données telles que le symbole et le nom du graphique de crypto-monnaie avec Octoparse.

1.1.png

Voici les principales étapes de ce tutoriel: [Télécharger le fichier de tâche ici ]

  1. "Aller à la page Web" - ouvrir la page Web cible
  2. Auto-détecter la page Web - créer un flux de travail 
  3. Extraire les données - pour modifier les champs de données
  4. Modifier XPath de Pagination - pour corriger le scraping sans cesse
  5. Démarrer l'extraction - exécuter la tâche et obtenir des données
 

 

1. "Aller à la page Web" - ouvrir la page Web cible

  • Entrez l'URL de la page sur l'écran d'accueil et cliquez sur "Démarrer" pour créer une nouvelle tâche

1.png

 

 

2. Auto-détecter la page Web - créer un flux de travail 

  • Choisissez à nouveau "Détecter automatiquement les données de la page Web" et attendez que la détection soit terminée

3.png

  • Cliquez sur "Changer les résultats de la détection automatique" dans le panneau Tips pour localiser le graphique.
  • Décochez "Ajouter un défilement de page"
  • Cliquez sur "Créer un workflow"

2.5.gif

  • Cliquez pour ouvrir les paramètres de l'action "Cliquer pour paginer"
  • Prolonger le délai d'attente AJAX entre 7-10 s

1.png

 

 

3. Extraire les données - pour modifier les champs de données

  • Cliquez pour ouvrir les paramètres de l'action "Extraire les données"
  • Supprimez les champs indésirables en cliquant sur l'icône mceclip13.png
  • Renommez les champs en cliquant sur le nom du champ

4.1.gif

Tips!

  • Un nom de champ inclure seulement des lettres, des chiffres et "_". 
  • Un nom de champ ne peut pas commencer par un nombre ou "_".
 

 

4. Modifier XPath de Pagination - pour corriger le scraping sans cesse

Le XPath de pagination généré automatiquement doit être modifié; sinon, le scraping ne peut pas être arrêté. Octoparse continuera à scraper la dernière page. Veuillez consultez les détails de ce problème ici.

  • Cliquez les paramètres de pagination pour ouvrir
  • Entrez le nouveau XPath //button[not(@disabled)]//span[text()="Next"]
  • Cliquez sur "OK" pour confirmer

5.gif

 

 

5. Démarrer l'extraction - exécuter la tâche et obtenir des données

  • Cliquez sur "Enregistrer"
  • Cliquez sur "Démarrer" dans le côté supérieur gauche
  • Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre appareil, ou sélectionnez "Exécuter la tâche sur le cloud" pour exécuter la tâche sur le Cloud (uniquement pour les utilisateurs premium)

6.png

Vous pouvez exporter les données de résultat sous les formats tels que EXCEL, CVS, JSON ou dans votre base de données.

Voici l'exemple de production.

mceclip0.png

 

Tutorial en español: Scrapear información sobre criptomonedas de Yahoo Finance

También puedes leer más artículos de web scraping en el sitio web oficial

 

Auteur: Yina