undefined

Collecte des données derrière un login

Monday, April 25, 2022 9:36 AM

Lorsque les données ciblées sont derrière une authentification, il est toujours possible d'accéder aux données avec Octoparse. Il faut simplement entrer les informations de connexion (nom d'utilisateur et mot de passe) puis cliquer sur le bouton "sign-in" pour se connecter. Dans ce tutoriel, nous vous montrerons comment extraire des données derrière un login, ainsi que comment utiliser les cookies pour optimiser le flux de travail de votre tâche.

 

 

1) Entrez les informations de login pour vous connecter

2) Utiliser des cookies pour optimiser le flux de travail

 

 

 

1) Entrer les informations de login pour vous connecter 

 

  • Cliquez sur le champ de saisie du nom d'utilisateur sur la page Web

 

 

 

  • Sélectionnez "Entrer le texte" dans les conseils

 

 

  • Saisissez le nom d'utilisateur dans le champ de texte, cliquez sur "Confirmer", et le nom d'utilisateur saisi est automatiquement inséré dans le champ de texte du nom d'utilisateur sur la page Web

 

 

  • Cliquez sur "Continuer" et sélectionnez " bouton de clic " dans le panneau des conseils

 

 

(Configurer un délai d'attente AJAX approprié au besoin)

 

  • Suivez les mêmes étapes pour entrer le mot de passe

  • Cliquez sur le bouton "Connexion" de la page et sélectionnez " Bouton de clic " dans le panneau des conseils

 

 

 

Octoparse s'est connecté au site web avec succès !

 

 

 

 

Conseils !

Effacer les cookies

Comme tous les sites Web traitent les cookies différemment, pour que le flux de travail de la tâche fonctionne constamment, vous voudrez peut être commencer par les étapes de login à chaque fois que la tâche est exécutée. Pour cela, vous pouvez effacer tous les cookies enregistrés avant le chargement de la page de connexion. De cette façon, le site Web vous "oubliera" toujours et vous amènera à la page de connexion sur laquelle vous pourrez entrer toutes les informations de connexion.

 

  • Cliquez sur "Aller à la page Web" et sélectionnez "Options"

  • Sélectionnez "Effacer le cache avant d'ouvrir la page Web"

  • Cliquez sur "Appliquer" pour enregistrer

 

 

 

 

2) Utiliser des cookies pour optimiser le flux de travail

1. Conserver les cookies

La plupart du temps, vous pouvez optimiser le flux de travail en conserver les cookies dans la tâche après la connexion. De cette façon, Octoparse enverra les cookies conservés au site Web lors du chargement, et il y a de grandes chances que le site Web se souvienne de "vous" et passe les étapes de connexion. 

  • Passez en mode Browser en cliquant en haut à droite

 

 

  • Vous pouvez vous connecter au site Web comme vous le faites avec un navigateur ordinaire.

  • Après la connexion, allez dans les paramètres "Options" de l'action "Aller à la page web", cochez "Utiliser un cookie" et cliquez sur "Utiliser le cookie de la page actuelle".

 

 

 

  • Cliquez sur "Appliquer" pour conserver les paramètres

  • Maintenant, la page Web est normalement censée "se souvenir" de la connexion et sauter les étapes de connexion lors de la prochaine exécution du robot d'exploration

 

Conseils !

1. Un cookie conservé n'est efficace qu'avant son expiration

Les cookies peuvent se présenter sous différentes formes. Certains ont un délai d'expiration spécifique, d'autres expirent immédiatement lorsque le navigateur est fermé. Dans Octoparse, le cookie enregistré ne fonctionne plus lorsqu'il expire. Pour résoudre ce problème, vous devrez suivre à nouveau les étapes de connexion en mode navigateur afin d'obtenir et d'enregistrer le cookie mis à jour.

2. Votre mot de passe est bien protégé

  • Dans Octoparse, lorsque vous saisissez votre mot de passe, il n'est accessible que sur votre propre compte. Lorsqu'une tâche est exportée, le mot de passe conservé dans la tâche est automatiquement supprimé.
  • Toute information de connexion enregistrée sera supprimée définitivement de votre compte dès que la tâche sera supprimée.

 

3. Entrer un captcha manuellement pendant l'exécution d'une extraction locale

Si vous rencontrez un captcha, vous pouvez le renseigner manuellement lors de l'exécution de la tache locale. Cloud Extraction ne prend pas en charge la gestion des captchas.

Si vous avez besoin d'aide pour la configuration des tâches ou la collecte des données, soumettez un ticket à notre équipe d'assistance ! Nous vous répondrons dans les 24 heures.  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter