Toutes les collections
Utiliser Octoparse
Extraire les données derrière une connexion
Extraire les données derrière une connexion

Dans ce tutoriel, nous vous montrerons comment faire si vos données cibles sont accessibles après une connexion

Mis à jour il y a plus d’une semaine

Lorsque les données ciblées sont derrière une authentification, il est toujours possible d'accéder aux données avec Octoparse.

Dans ce tutoriel, nous vous montrerons comment extraire des données derrière un login, ainsi que comment utiliser les cookies pour optimiser le flux de travail de votre tâche.


Entrer les identifiants de connexion pour vous connecter

  • Cliquez sur le champ de saisie du nom d'utilisateur sur la page Web

  • Sélectionnez Saisir le texte dans le panneau de conseils

  • Saisissez le nom d'utilisateur dans le champ de texte, cliquez sur "Confirmer", et le nom d'utilisateur saisi est automatiquement inséré sur l'endroit correct de la page Web.

  • Répéter les mêmes étapes pour saisir le mot de passe.

  • Cliquer sur le bouton de Se connecter et puis choisir Cliquer sur le bouton dans le panneau de Conseils.

Dès maintenant, la connexion est réussie !

Effacer les cookies

Comme tous les sites Web traitent les cookies différemment, pour que le flux de travail de la tâche fonctionne constamment, vous devriez peut être commencer par les étapes de connexion à chaque fois que la tâche est exécutée.

Pour cela, vous pouvez effacer tous les cookies enregistrés avant le chargement de la page de connexion. De cette façon, le site Web vous "oubliera" toujours et vous amènera à la page de connexion sur laquelle vous pourrez entrer toutes les informations de connexion.

  • Cliquez sur "Aller à la page Web" et sélectionnez "Options"

  • Sélectionnez "Effacer le cache avant de charger la page Web"

  • Cliquez sur "Appliquer" pour enregistrer


Utiliser des cookies pour optimiser le flux de travail

1. Conserver les cookies

Dans la plupart de cas, vous pouvez optimiser le flux de travail en conserver les cookies dans la tâche après la connexion. De cette façon, Octoparse enverra les cookies conservés au site Web lors du chargement, et il y a de grandes chances que le site Web se souvienne de "vous" et passe les étapes de connexion.

  • Passez au mode de navigation

  • Vous pouvez vous connecter au site Web comme vous le faites avec un navigateur ordinaire.

  • Après la connexion, allez dans les paramètres Options de l'action Aller à la page web, cochez Utiliser un cookie et cliquez sur "Utiliser le cookie de la page actuelle".

  • Cliquez sur "Appliquer" pour conserver les paramètres

  • Maintenant, la page Web est normalement censée "se souvenir" de la connexion et sauter les étapes de connexion lors de la prochaine exécution du robot d'exploration

A noter :

1. Un cookie conservé n'est efficace qu'avant son expiration

Les cookies peuvent se présenter sous différentes formes. Certains ont un délai d'expiration spécifique, d'autres expirent immédiatement lorsque le navigateur est fermé. Dans Octoparse, le cookie enregistré ne fonctionne plus lorsqu'il expire. Pour résoudre ce problème, vous devrez suivre à nouveau les étapes de connexion en mode navigateur afin d'obtenir et d'enregistrer le cookie mis à jour.

2. Votre mot de passe est bien protégé

Dans Octoparse, si vous saisissez votre mot de passe, il n'est accessible que sur votre propre compte. Lorsqu'une tâche est exportée, le mot de passe conservé dans la tâche est automatiquement supprimé.

Toute information de connexion enregistrée sera supprimée définitivement de votre compte dès que la tâche sera supprimée.

3. Entrer un captcha manuellement pendant l'exécution d'une extraction locale

Si vous rencontrez un captcha, vous pouvez le renseigner manuellement lors de l'exécution de la tache locale.

Octoparse peut résoudre certains genres de Captchas automatiquement. Consulter cet article pour savoir davantage : Résoudre le Captcha

Avez-vous trouvé la réponse à votre question ?