undefined

Qu'est-ce qu'une tâche? (Version 8)

Thursday, May 27, 2021 10:52 AM

 

Tout ce que vous faites dans Octoparse commence par la création d'une tâche. Une tâche de grattage est également appelée "un robot" ou "un agent" dans Octoparse. Quel que soit son nom, une tâche est essentiellement un ensemble d'instructions que le programme doit suivre.

C'est tout simple de construire une tâche dans Octoparse. Vous allez d'abord entrer l'URL de votre page Web cible pour la charger dans Octoparse, puis cliquez pour sélectionner les données que vous voulez récupérer. Une fois les données dont vous avez besoin sélectionnées, un flux de travail sera généré automatiquement en fonction de la façon dont vous avez interagi avec la page Web, cliquer sur un certain bouton, survoler le curseur sur le menu de navigation ou cliquer pour sélectionner des données sur la page par exemple.

Octoparse simule les actions de navigation réelles des humains, telles que le clic, la recherche, la pagination et enfin la récupération des données cibles. Tous ces étapes peuvent être vérifiées et consultées dans le flux de travail. C'est ainsi qu'Octoparse fonctionne pour extraire les données à partir de pages Web différentes.

 

Mode avancé vs. Modèles de tâches

Il y a deux méthodes pour créer une tâche de grattage dans Octoparse. Vous pouvez soit créer une tâche en mode avancé, soit choisir un modèle de tâche pour commencer.

8714871719819.png

 

Mode avancé

Avec le mode avancé, vous pouvez personnaliser votre propre tâche comme vous le souhaitez - rechercher avec des mots-clés, vous connecter à votre compte, cliquer dans une liste déroulante, et bien plus encore. En somme, le mode avancé vous offrira tout ce dont vous avez besoin pour récupérer les données de n'importe quel site Web.

 

1651561651561165165.png

 

 

Modèles de tâches

Différenciés du mode avancé, les modèles de tâches fournissent un grand nombre de modèles prédéfinis pour scrapper les sites Web les plus populaires. Comme ces tâches sont prédéfinies, vous n'avez donc qu'à saisir quelques éléments variables, tels que le terme de recherche, l'URL de la page cible afin de récupérer un ensemble prédéfini de données à partir du site Web particulier.

 

6516516516165.png

 

Vous êtes prêt à prendre en main les données? Suivez nos leçons d'introduction pour apprendre étape par étape la façon de créer votre première tâche.

 

 

Remarques:

  1. L'interface de la version7 et de la version8 est différente, la fonctionnalité Au-détection n'est disponible que sur la version8
  2. La fonctionnalité Au-détection vous aidera à créer le flux de travail de base. Vous pouvez le modifier ou l'optimiser ensuite pour répondre à vos propres besoins
  3. Généralement, la récupération des données à partir d'un site Web (ou des URL dans un domaine) aurait besoins d'utilisation d'une tâche / un crawler. C'est parce qu'une tâche / crawler ne peut extraire que des données à partir des pages d'une structure similaire. Mais c'est possible de récupérer des adresses e-mail à partir d'une liste de sites Web en utilisant un crawler, voici les tutoriels en la matière pour votre référence: Puis-je extraire des adresses e-mail d'une série de sites Web totalement différents?

 

 

Tips pour gérer vos tâches

  1. Modifeier les informations de tâches

Le nom de tâche est automatiquement créé lorsque vous enregistrez l'URL saisie.

   · Pour modifier le nom de tâche, cliquez sur la zone de texte au-dessus du panneau de flux de travail et entrez un nouveau nom.

   

1956156156165136.png

 

  · Ou cliquez sur  pour modifier le nom d'une tâche enregistrée

 

1651561651651561.png

 

2. Plus d'actions pour gérer vos tâches

Voici d'autres actions de gestion de tâches que vous pouvez utiliser.

Options de gestion des tâches offertes dans "Plus d'Actions"

      · "Modifier" - Modifier la tâche (Ou double-cliquez justement sur le nom de la tâche dans le tableau de bord pour le modifier.)

      · "Supprimer" - Supprimer la tâche

      · "Renommer" - Renommer la tâche

      · "Paramètres" - Paramètres de base (y compris le groupe de tâches et la description) et les paramètres d'extraction

        (la répartition de tâches cloud & les paramètres de chargement d'image & le blocage de publicités y sont compris ; ainsi que le changement d'agent utilisateur du navigateur; l'extraction incrémentielle sur cloud)

      · "Répliquer" - Répliquer la tâche

      · "Exporter" - Exporter la tâche

1_6512_62626262.png

 

Pour gérer les tâches par lots:

      · Sélectionnez plusieurs tâches (cela fonctionne également pour sélectionner une seule tâche).

      · Sélectionnez les tâches ici présentées pour les opérer par lots

      · Pour annuler les éléments sélectionnés, cliquez sur "Désélectionner"

165165165165165165.png

 

 

Auteur: Kara

Editeur: Isabel

 

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter