Q : Puis-je scraper des pages nécessitant une connexion ?

R : Ce modèle est conçu pour les pages publiques. Pour les pages nécessitant une connexion, vous devrez configurer le partage de cookies dans une tâche personnalisée. Toutefois, ce modèle fonctionne de manière optimale avec des informations accessibles publiquement.

Q : Pourquoi le champ “content” apparaît-il au format JSON dans le fichier CSV ?

R : Afin de préserver la structure du contenu (paragraphes, titres) dans une seule cellule du tableur, le contenu est souvent encapsulé sous forme d’objet JSON ou de chaîne Markdown. Cela permet de conserver le formatage d’origine lorsque vous traitez les données de manière programmatique.

Q : Combien d’URLs puis-je scraper en une seule fois ?

R : Vous pouvez saisir des milliers d’URLs. Pour les tâches dépassant 10 000 URLs, nous recommandons de les diviser en plusieurs lots ou d’utiliser Cloud Extraction afin d’accélérer le processus.

Contenu Universel Scraper | Modèle d'Octoparse