Octoparse ne récupère pas seulement les informations de la page web, mais aussi les données au niveau de la page, y compris l'URL de la page web, le titre de la page, la méta-description, les méta-mots-clés et le code source HTML.
Vous pouvez facilement suivre les étapes ci-dessous pour les ajouter :
ÉTAPE 1 : Ajouter Extraire des données dans le flux de travail.
ÉTAPE 2 : Allez dans la section Aperçu des données puis cliquez sur le bouton Ajouter des champs personnalisés.
ÉTAPE 3 : Sélectionnez votre champ de données souhaité dans les champs de données de niveau page.
ÉTAPE 4 (facultative) : Renommez le champ de données en double-cliquant sur le nom du champ.
URL de la page : URL de la page actuelle.
Titre de la page : titre de la page actuelle, qui est une brève description d'une page web et apparaît en haut de la fenêtre du navigateur.
Méta-description : balise de méta-description de la page actuelle, qui contient un résumé de la page.
Méta-mot clé : balise méta-mot clé de la page actuelle
Code source HTML : le code HTML complet de la page web.