Dans ce tutoriel, nous allons vous montrer comment utiliser Octoparse pour extraire des données au niveau de la page, y compris les URL de page Web, les titres de page, les méta-descriptions, les méta-mots-clés et le code source HTML.

Comment ajouter les données

1. Accédez à l'action "Extraire les données", cliquez sur "Paramètres de l'action"

456121212.png

2. Cliquez sur 561651651.pngpour "Ajouter des champs de données"

16513612.png

 

3. Survolez ou cliquez sur "Données au niveau de la page" pour sélectionner les données au niveau de la page que vous souhaitez

Les données sélectionnées au niveau de la page seront ajoutées automatiquement dans "Champ de données".

1262626.png

 

4. Renommez le champ de données si nécessaire

126323.png

 

Tips!

Vous pouvez aussi ajouter des champs dans le panneau "Aperçu des données". Cliquez sur l'icône mceclip1.png pour voir les options dans la liste déroulante.

mceclip2.png

Signification des champs

  • Titre de la page : gratter le contenu de la balise titre.

    mceclip7.png

    Il s'agit d'une brève description de la page Web, affichée en haut de la fenêtre du navigateur.

    mceclip3.png 

  • Méta description : récupérer le contenu de la balise méta description

    mceclip6.png

    The tag contains a summary of the page content. 

  • Méta-mot-clé : grattez le contenu de la balise méta-mot-clé

    mceclip8.png

    Lorsque les utilisateurs ont besoin d'améliorer leur référencement, le grattage des titres de page, des méta-descriptions et des méta-mots-clés est très utile.

  • Code source HTML : le code HTML complet de la page web

 

Tutorial en español:  Extraer datos del nivel de página (metadatos, URL de la página, título de la página, código fuente)

También puedes leer más tutoriales de web scraping en sitio web oficial

 

Si vous avez besoin d'aide pour la configuration des tâches ou la collecte de données, envoyez un ticket à notre équipe d'assistance! Nous vous répondrons bientôt.

Auteur: Kara

Editeur: Yina