undefined

Leçon 0: Les bases d'Octoparse

Thursday, October 14, 2021 11:41 AM

Bonjour! Bienvenue dans la nouvelle version Octoparse 8.4! Dans la nouvelle version, On a fait des changements. Donc, nous sommes en train de mettre ensemble de cette nouvelle série d'apprentissage qui vous aide en extrayant les données dont vous avez besoin.

Après avoir vu toutes les leçons d'introduction, vous connaîtrez Octoparse 8.4 à fond et vous pourrez extraire les données de la plupart des pages Web. Il faudrait environ 30 à 60 minutes pour terminer la lecture de toutes les leçons. S'amusez-vous!

Commençons par présenter l'interface et couvrir les fonctionnalités de base.

 

1. L'interface

  • L'écran d'accueil
  • Le menu de la barre latérale
  • L'espace de travail

2. Fonctionnalités Principales

  • Utilisation des modèles de tâches
  • Scraper des données avec le Mode Avancé
  • Extraction Cloud

 

1. L'interface

Dès que vous vous connectez à Octoparse, vous trouverez deux sections principales: l'écran d'accueil et la barre latérale.

 

2021-09-08_14-28-10.png

 

1.1 L'écran d'accueil

Une barre de recherche se trouve au centre de l'écran d'accueil. Vous pouvez entrer la ou les URL de la page Web cible pour commencer à créer une tâche ou vous pouvez également entrer un nom de modèle (tel qu'Amazon ou eBay) pour rechercher un modèle de scraping prédéfini.

 

 999999999999.gif

 

Vous pouvez aussi accéder à certains des modèles de scraping et des tutoriels les plus populaires sur l'écran d'accueil.
 

1.2 Le menu de la barre latérale

 Le menu de la barre latérale sur la gauche contient tout ce dont vous avez besoin pour naviguer dans Octoparse.

  • +Nouveau bouton: créer / importer une nouvelle tâche ou créer de nouveaux groupes de tâches.

 

 

mceclip0.png

 

  • Tableau de bord: C'est le seul endroit gérant toutes vos tâches de scraping. Modifiez, supprimez, renommez et organisez toutes les tâches de votre compte. Vous pouvez facilement exécuter, arrêter ou planifier des tâches.

 

dashboard.png

 

  • Filtres Rapides & Tâches Récentes: Utilisez ces raccourcis pour accéder rapidement à vos tâches.
  • Nous contacter: Cliquez ici pour rechercher un tutoriel ou lancer une discussion rapide avec nous si vous avez des questions !
     

Contact_us.png

 

1.3 L'espace de Travail

L'espace de travail Octoparse est l'endroit où vous construirez votre tâche. Il se compose de 5 parties principales, chaque partie remplissant son rôle particulier.

 

2021-09-08_11-00-58.png

 

    • Le navigateur intégréUne fois que vous avez entré une URL de page Web cible, la page Web sera chargée dans le navigateur intégré d'Octoparse. vous pouvez parcourir le site Web en Mode Parcourir ou vous pouvez cliquer pour extraire les données dont vous avez besoin en Mode Sélection.
    • Conseils d'action (Tips): Octoparse utilise des astuces intelligentes pour vous «parler» pendant le processus d'extraction, pour vous guider tout au long du processus de création de tâches.

    • Le flux de travail (Workflow): A mesure que vous interagissez avec la page Web, comme en ouvrant une page Web et en cliquant sur un élément / bouton de page, l'ensemble du processus est défini automatiquement sous la forme d'un flux de travail.
    • Paramètres (Settings): Les options de paramètres pour les actions dans le workflow seront affichées après que vous ayez sélectionné une action.
    • Aperçu des Données (Data Preview): Avoir un aperçu des données sélectionnées. Vous pouvez également renommer les champs de données ou supprimer ceux qui ne sont pas nécessaires.

 

2. Fonctionnalités Principales

2.1 Modèles de Tâches

Les Modèles de Tâches sont des tâches prédéfinies qui permettent aux utilisateurs d'obtenir des données en entrant des paramètres simples tels que des URL ou des mots-clés. Il existe actuellement plus de 60 modèles pour les sites Web les plus populaires. Il n'est pas nécessaire de construire quoi que ce soit et aucune compétence technique requise. Sélectionnez simplement un modèle dont vous avez besoin, vérifiez les exemples de données pour voir s'il obtient ce dont vous avez besoin et extrayez les données immédiatement!

 

wewewewewe.gif

2.2 Scraping des données avec le Mode Avancé

Au contraire, les modèles de tâches où tout est déjà prédéfini, le mode avancé Octoparse est un mode de grattage très flexible et puissant qui vous permet de créer une tâche de grattage personnalisée selon vos besoins spécifiques. Le mode avancé est suffisamment robuste pour scraper des pages Web complexes, comme des pages avec JavaScript, AJAX ou tout autre site Web dynamique.
 

Avec le mode avancé, vous construisez votre propre tâche de scraping, c'est facile. Avec le nouvel algorithme de détection automatique, Octoparse détecte automatiquement les éléments sur une page et génère les paramètres de tâche recommandés tels que l'extraction de la liste et la pagination.
 advanced.gif

 

Outre les données détectées automatiquement, vous pouvez modifier manuellement les paramètres de la tâche ou créer une tâche à partir de zéro en ignorant l'étape de détection automatique.
 ----------------.gif

 

Une fois que vous êtes satisfait des données détectées automatiquement, enregistrez simplement les paramètres et Octoparse générera automatiquement le workflow de la tâche. Vous pouvez ajouter des étapes supplémentaires au flux de travail ou modifier les actions manuellement si nécessaire.
 

2.3 Extraction Cloud

Octoparse fournit une puissante plate-forme Cloud pour les utilisateurs premium (Standard et supérieur) pour exécuter vos tâches 24/7. Quand vous exécutez une tâche avec "Extraction Cloud", elle s'exécute dans le Cloud avec plusieurs serveurs utilisant nos IP. Vous pouvez arrêter l'application ou votre ordinateur pendant l'exécution de la tâche. Il n'y a pas lieu de s'inquiéter des limitations matérielles.

Les données extraites seront enregistrées dans le cloud et accessibles à tout moment. Des fonctionnalités avancées telles que la rotation IP automatique, la planification des tâches, la vitesse d'extraction et l'API Octoparse font toutes partie du service Octoparse Cloud.

 

Bon travail pour arriver ici! Vous avez déjà saisi les bases d'Octoparse.


Pour connaître comment créer votre première tâche de scraping, continuez à 
>> Leçon 1: Extraire des données avec le tout nouvel algorithme de détection automatique

 

Auteur : L'équipe Octoparse

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter