undefined

Entrer URL par lot (Version 8)

Thursday, July 08, 2021 12:49 AM

Qu'est-ce que la saisie d'URL par lot ?

La fonctionnalité de saisie d'URL par lots peut importer à la fois un grand nombre d'URL dans Octoparse. Vous pouvez importer par lots des URL à partir des fichiers locaux (texte ou feuille de calcul), d'autres tâches et même générer des URL basées sur des modèles prédéfinis avec Octoparse.

 

Comment saisir des URL par lots ?

Cliquez sur "+Nouveau" pour créer une nouvelle tâche, sélectionnez "Mode avancé" et le panneau d'importation d'URL s'affichera.t1.gif

Il y a trois manières d'importer des URL par lots dans une tâche/un crawler (jusqu'à un million d'URL) :

1) Importer des URL à partir d'un fichier

2) Importer des URL à partir d'une autre tâche

3) Générer par lots des URL basées sur un modèle prédéfini

Tips!

Une fois que le nombre d'URL importées/générées atteint la limite de 1 million, Octoparse arrêterait immédiatement le processus d'importation/de génération.

 

 

1) Importer des URL à partir d'un fichier

Vous pouvez importer des URL à partir des fichiers de formats ci-dessous,

- CSV

- TXT

- Excel (.xlsx & .xls)

1. Sélectionnez "Importer d'un fichier".

2. Cliquez sur "Sélectionner" , choisissez ensuite le fichier, la feuille et la colonne contenant les URL.

3. Cliquez sur "Enregistrer" pour terminer le processus d'importation.

1234.png

Remarque : Seulement les 100 premières URL seront affichées pour l'aperçu.

 

2) Importer des URL à partir d'une autre tâche

Lorsque vous devez exécuter une tâche d'extraction d'URL séparément d'une autre tâche, cette fonction peut intégrer de manière simultanée les deux tâches. Vous n'avez donc plus besoin d'exporter et d'importer manuellement des URL.

1. Sélectionnez "Importer de la tâche".

2. Sélectionnez la tâche contenant les URL cibles, et le champ de données approprié.

3. Cliquez sur "Enregistrer" pour terminer le processus d'importation.

t5.gif

Veuillez noter que la tâche sélectionnée (la tâche qui contient les URL requises pour l'exploration) est appelée la tâche parent, et la nouvelle tâche à configurer avec l'URL est une tâche enfant. Les deux tâches seront automatiquement associées et pourront être exécutées en association l'une avec l'autre.

Tips!

1. Vous pouvez configurer l'exécution des tâches enfants en fonction de l'état de la tâche parente dans le cloud. Si vous configurez des opérations associées en sélectionnant une option dans les paramètres de la tâche parent, les deux tâches seront exécutées dans le cloud via Octoparse Cloud Service . L'opération associée ne peut pas être appliquée pour l'Extraction Locale .

2020-07-29_21-14-17.png

2. Après avoir défini l'opération associée, la planification des tâches  ne peut plus être utilisée pour exécuter la tâche enfant.

 

 

 

 3) Générer par lots des URL basées sur un modèle prédéfini

Avec la fonctionnalité "génération par lots", vous pouvez facilement générer un grand nombre d'URL selon un modèle spécifique en modifiant divers paramètres d'une URL donnée.

1. Sélectionnez "Générer par lots".

2. Saisissez une URL comme base de la génération par lots.

3. Mettez en surbrillance le paramètre d'URL sélectionné et cliquez sur "Ajouter un paramètre".

4. Choisissez parmi les quatre options de type de paramètre pour définir le mode dont vous avez besoin, puis cliquez sur "Enregistrer l'URL" pour enregistrer la liste.

t6.gif

Quatre options de type de paramètre

    - Type 1: Chiffres

mceclip0.png

    - Type 2: Lettres

mceclip1.png

    - Type 3: L'heure

mceclip2.png

    - Type 4: Liste customisée

mceclip3.png

 

Tips!

Vous pouvez configurer plusieurs paramètres pour générer des URL. Par exemple, si l'URL de base est www.XXX.com/[parameter1]/[parameter2]

Parameter1={A, B}, Parameter2={1, 2}

La liste d'URL finale serait:

www.XXX.com/A/1

www.XXX.com/B/1

www.XXX.com/A/2

www.XXX.com/B/2

 

Si vous avez des questions, vous pouvez soumettre une demande ici. Notre équipe d'assistance vous recontactera ultérieurement.

 

Artículo en español:  Ingresar URLs por lotes

También puedes leer artículos de web scraping en sitio web oficial

 

Auteur: Fergus

Editeur: Tina

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter