Toutes les collections
Glossaire
C'est quoi l'extraction de Cloud ?
C'est quoi l'extraction de Cloud ?

Ce tutoriel va vous expliquer c'est quoi l'extraction dans le Cloud et les avantages de cette façon de scraping.

Mis à jour il y a plus d’une semaine

Lorsqu'une tâche est exécutée avec Cloud Extraction, elle tire parti de plusieurs serveurs utilisant les IP d'Octoparse. Vous pouvez éteindre l'APP ou même votre ordinateur pendant l'exécution de la tâche. Vous n'avez pas à vous soucier des limitations matérielles. Les données extraites seront sauvegardées dans le cloud et pourront être consultées à tout moment.

La planification des tâches est également prise en charge par l'extraction Octoparse Cloud. Pour récupérer les informations les plus récentes, vous pouvez programmer l'exécution de votre tâche aussi souvent que vous le souhaitez.

1. Exécutez votre tâche avec une extraction dans le Cloud :

Lorsque vous avez terminé de configurer votre tâche, cliquez sur "Exécuter" et sélectionnez "Exécuter la tâche dans le cloud" pour exécuter une exécution dans le cloud.

2. Exécutez des tâches par lots avec l'extraction dans le Cloud :

Sélectionnez toutes les tâches qui doivent être exécutées, cliquez sur "Exécuter (Cloud)" et les tâches seront exécutées ensemble dans le Cloud.

3. Paramètres de l'extraction de clouds :

L'extraction dans le nuage d'Octoparse permet d'exécuter plusieurs tâches simultanément.

Sur le plan standard, vous pouvez exécuter 6 tâches simultanées dans le cloud (6 serveurs cloud disponibles), et sur le plan professionnel, vous pouvez exécuter 20 tâches simultanées (20 serveurs cloud disponibles). Pour définir le nombre maximal de tâches exécutées en parallèle, cliquez et sélectionnez le nombre souhaité dans les options déroulantes :


TIPS :

Quelles sont les performances de l'extraction dans le Cloud ?

  • L'extraction de données dans le nuage peut être beaucoup plus rapide que l'exécution des tâches localement si la tâche est divisée en tableaux.

Une tâche à tableau partagé peut être décomposée en plusieurs sous-tâches qui peuvent être exécutées sur plusieurs serveurs simultanément, ce qui accélère l'extraction.

  • Puis-je exécuter plus de tâches que le nombre maximal prévu ?

Oui, vous le pouvez. Mais certaines des tâches seront mises en file d'attente jusqu'à ce que d'autres serveurs en nuage soient disponibles après l'achèvement des tâches précédentes.

4. Planifier une exécution dans le Cloud :

4.1 Pour une seule tâche

Lorsque vous avez terminé la configuration de votre tâche, cliquez sur Exécuter et sélectionnez Planifier (Cloud).

Sélectionnez la fréquence et personnalisez l'heure et la date en fonction de vos besoins. Cliquez sur Enregistrer et exécuter et la tâche sera exécutée comme prévu.

L'heure de la prochaine exécution peut être trouvée sur le tableau de bord dans la colonne Prochaine exécution.

Et si vous souhaitez annuler une exécution programmée, cliquez sur Plus, et sélectionnez Programmer l'arrêt des exécutions dans le Cloud.

FAQ : Quel est le fuseau horaire par défaut de la plateforme Octoparse Cloud ?

L'heure de la prochaine exécution affichée sur le tableau de bord correspond par défaut à votre fuseau horaire local (selon votre système d'exploitation). Cependant, si vous avez construit la tâche pour extraire "la date et l'heure actuelles" dans le Cloud, l'heure et la date extraites seront en UTC±00:00 indépendamment de votre emplacement réel.

Actuellement, Octoparse ne prend pas en charge la modification du fuseau horaire.

4.2 Pour un groupe de tâches

Accédez à votre tableau de bord, passez à la vue Groupe de tâches, sélectionnez votre groupe de tâches cible, puis cliquez sur l'icône de l'horloge pour définir un calendrier pour le groupe de tâches.

5. Questions fréquemment posées

5.1. Que sont les extractions simultanées de Cloud ?

L'extraction simultanée dans le cloud signifie le nombre maximum de tâches que vous pouvez exécuter en même temps. Si vous êtes sur le plan standard, vous pouvez exécuter au maximum 6 extractions simultanées dans le nuage parce que vous avez 6 serveurs de nuage (une tâche a besoin d'au moins un serveur pour fonctionner).

Veuillez noter que parfois vous ne pouvez pas exécuter 6 tâches dans le nuage parce qu'une tâche fractionnable peut prendre plus ou tous les serveurs de votre compte. Une fois qu'une tâche occupe tous les serveurs, les autres tâches doivent attendre la ressource du nuage pour les exécuter.

5.2. Qu'est-ce qui affecte le nombre d'extractions simultanées ?

Les principaux facteurs qui influencent vos extractions simultanées sont 1) le nombre de serveurs cloud dont vous disposez et 2) le nombre de serveurs occupés par vos tâches en cours.

Par exemple, vous êtes sur le plan standard, ce qui signifie que vous avez 6 serveurs cloud. Si vous avez 6 tâches, et que ces tâches ne prennent qu'un serveur chacune lorsqu'elles sont en cours d'exécution, vous verrez 6 tâches en cours d'exécution en même temps.

Si l'une des tâches occupe 2 serveurs (elle est divisée en 2 sous-tâches ou plus), vous ne verrez que 4 tâches fonctionner en même temps. Si la tâche occupe 6 serveurs, vous ne verrez qu'une seule tâche en cours d'exécution.

Avez-vous trouvé la réponse à votre question ?