Scraper des données d'un tableau
Monday, November 28, 2022 5:57 PMLes données de tableau sont courantes sur les sites Web liés à la finance, au sport, etc. Ce tutoriel vous guidera sur la façon de récupérer des données de tableau.
Comment collecter les données d'une table avec Octoparse ? Allez-y avec ce tutoriel !
URL du cas : https://money.cnn.com/data/hotstocks/index.html
1. Utiliser la fonction d'auto-détection pour mettre en place le flux de travail
Octoparse prend en charge la détection automatique de la table et la capture de toutes les colonnes. Avec cette fonction, vous devez simplement
- Copiez l'URL dans Octoparse et cliquez sur Start pour créer une nouvelle tâche.
- Cliquez sur Détection automatique des données de la page Web dans le panneau Conseils pour créer un flux de travail.
- Vérifiez que toutes les cellules du tableau ont été capturées et cliquez sur Créer le flux de travail.
2. Configurer le flux de travail manuellement
Que se passe-t-il si la détection automatique échoue ou si elle ne collecte pas les données complètes de la table ? Dans ce cas, vous devez configurer la tâche manuellement. Voici les étapes à suivre :
- Sélectionnez la première cellule de la première ligne du tableau, puis cliquez sur le bouton Étendre la zone de sélection jusqu'à ce que toute la première ligne soit sélectionnée.
CONSEIL : Vous pouvez cliquer sur Désactiver la détection automatique ou Annuler la détection automatique pour arrêter la détection automatique si elle démarre automatiquement.
- Choisissez Sélectionner tous les sous-éléments dans le panneau Astuces.
Tous les sous-éléments de la première ligne sont sélectionnés, puis Octoparse trouve d'autres éléments similaires surlignés en rouge.
- Choisissez Sélectionner tout dans le panneau Conseils.
Tous les sous-éléments du tableau sont sélectionnés et mis en évidence en vert.
- Cliquez sur Extraire les données dans le panneau Conseils.
- Modifiez les champs de données si nécessaire (facultatif)
-
Double-cliquez sur le nom du champ pour renommer les champs de données.
-
Cliquez sur le bouton Plus à côté du nom du champ pour effectuer d'autres actions : supprimer, copier, nettoyer les données, etc.