undefined

Scraper des données d'un tableau

Monday, November 28, 2022 5:57 PM

Les données de tableau sont courantes sur les sites Web liés à la finance, au sport, etc. Ce tutoriel vous guidera sur la façon de récupérer des données de tableau.

 

Comment collecter les données d'une table avec Octoparse ? Allez-y avec ce tutoriel !

URL du cas : https://money.cnn.com/data/hotstocks/index.html

 

 

 

1. Utiliser la fonction d'auto-détection pour mettre en place le flux de travail


Octoparse prend en charge la détection automatique de la table et la capture de toutes les colonnes. Avec cette fonction, vous devez simplement

  •  Copiez l'URL dans Octoparse et cliquez sur Start pour créer une nouvelle tâche.

 

  • Cliquez sur Détection automatique des données de la page Web dans le panneau Conseils pour créer un flux de travail.

 

 

  • Vérifiez que toutes les cellules du tableau ont été capturées et cliquez sur Créer le flux de travail.

2. Configurer le flux de travail manuellement


Que se passe-t-il si la détection automatique échoue ou si elle ne collecte pas les données complètes de la table ? Dans ce cas, vous devez configurer la tâche manuellement. Voici les étapes à suivre :

  • Sélectionnez la première cellule de la première ligne du tableau, puis cliquez sur le bouton Étendre la zone de sélection jusqu'à ce que toute la première ligne soit sélectionnée. 

CONSEIL : Vous pouvez cliquer sur Désactiver la détection automatique ou Annuler la détection automatique pour arrêter la détection automatique si elle démarre automatiquement.

 

  • Choisissez Sélectionner tous les sous-éléments dans le panneau Astuces.

 

 

Tous les sous-éléments de la première ligne sont sélectionnés, puis Octoparse trouve d'autres éléments similaires surlignés en rouge.

 

 

 

 

 

  • Choisissez Sélectionner tout dans le panneau Conseils.

 

 

 

Tous les sous-éléments du tableau sont sélectionnés et mis en évidence en vert.

 

 

  • Cliquez sur Extraire les données dans le panneau Conseils.

 

  • Modifiez les champs de données si nécessaire (facultatif)
  • Double-cliquez sur le nom du champ pour renommer les champs de données.

  •  Cliquez sur le bouton Plus à côté du nom du champ pour effectuer d'autres actions : supprimer, copier, nettoyer les données, etc.

 

 

 

 

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter