undefined

Scraper les données derrière la connexion (version 8)

Friday, July 02, 2021 3:55 PM

Lorsque les données cibles sont derrière l'authentification, il est encore possible d'y accéderavec Octoparse. Saisissez par texte les informations de connexion (nom d'utilisateur et mot de passe) puis cliquez sur le bouton "Se connecter" pour vous connecter. Dans ce tutoriel, nous allons vous montrer comment extraire des données derrière une connexion, et comment utiliser les cookies pour optimiser le workflow de votre tâche.

16156156156156.png

 

1) Entrer les informations de connexion pour vous connecter

2) Utiliser les cookies pour optimiser le workflow

 

 

Entrer les informations de connexion pour vous connecter

  • Cliquez sur la zone de texte pour saisir le nom d'utilisateur sur la page Web

1961561651561.png

  • Sélectionnez "Saisir du texte" de Tips d'Actions
  • 195195681256125.png
  • Entrez le nom d'utilisateur dans la zone de texte, cliquez sur "Confirmer". Le nom d'utilisateur entré sera automatiquement saisi dans la zone de texte du nom d'utilisateur sur la page Web

19561562.png

  • Cliquez sur "Continuer" et sélectionnez "Cliquer sur le bouton" dans le panneau Tips

2020-08-02_12-35-21.png

(Configurez un délai d'expiration AJAX approprié si nécessaire.)

  • Répétez les mêmes étapes pour entrer le mot de passe
  • Cliquez sur le bouton "Se connecter" sur la page et sélectionnez "Cliquer sur le bouton" dans le panneau Tips

2020-08-02_12-42-10.png

 

 Vous vous êtes maintenant connecté au site Web avec succès dans Octoparse!

897912512328.gif

 

Tips!

Nettoyer les cookies

Comme tous les sites Web appliquent de méthodes différentes pour gérer les cookies, pour vous assurer que le workflow de la tâche fonctionnera de manière cohérente, vous pouvez faire commencer par les étapes de connexion pour chaque exécution de la tâche. Pour ce faire, vous pouvez effacer tous les cookies enregistrés avant le chargement de la page de connexion. De cette façon, le site Web cible vous "oubliera" toujours et vous amènera à la page de connexion sur laquelle vous pouvez entrer à nouveau les informations de connexion.

  • Double-cliquez sur l'action "Aller à la page Web" pour accéder aux paramètres de l'action
  • Sélectionnez "Effacer le cache avant d'ouvrir la page Web" dans les Paramètres de Cache

            149619615561561.png

 

 

 

 

Utiliser les cookies pour optimiser le workflow

1. Enregistrer les cookies

La plupart du temps, vous pouvez enregistrer les cookies dans la tâche après la connexion pour optimiser le workflow. De cette façon, Octoparse enverra les cookies enregistrés au site Web lors du chargement, et le site Web se souviendra de "vous" et ignore les étapes de connexion.

  • Cliquez sur 54656.jpg en haut à droite pour passez en mode Navigateur

195615612651256.png

 

  • Vous pouvez vous connecter au site Web comme vous le faite sur un navigateur ordinaire.

436345653.gif

  • Après la connexion, allez dans les paramètres de l'action "Aller à la page Web" et enregistrez les cookies.

2020-08-02_12-54-05.png

 

  • Maintenant, la page Web est censée "se souvenir" de la connexion et ignorera les étapes de connexion lors de la prochaine exécution de crawler.

 

Tips!

1. Le cookie enregistré n'est valable qu'avant son expiration

Les cookies se présentent sous de nombreuses formes différentes. Certains ont un délai d'expiration spécifique, d'autres expirent immédiatement à la fermeture du navigateur. Dans Octoparse, le cookie enregistré ne fonctionnera plus après qu'il est expiré. Pour résoudre ce problème, vous devrez suivre les étapes de connexion à nouveau en mode navigateur afin d'obtenir et d'enregistrer le cookie mis à jour.

2. Votre mot de passe est bien protégé

  • Dans Octoparse, lorsque vous saisissez votre mot de passe, il n'est accessible que sur votre propre compte. Après qu'une tâche est exportée, le mot de passe enregistré dans la tâche sera supprimé automatiquement.
  • Any login information saved will be removed from your account permanently as soon as the task is deleted.

3. Saisir manuelle le captcha lors de l'exécution de l'extraction locale

Si un captcha affiche pendant l'exécution locale de tâche, vous pouvez saisir manuellement le captcha. Octoparse n'offre pas de gestion de Captcha dans Extraction Cloud

 

Tutorial en español:  Extraer datos después del inicio de sesión

También puedes leer más tutoriales de web scraping en sitio web oficial

 

Si vous avez besoin d'aide pour la configuration de tâches ou la collecte de données, envoyez un ticket à notre équipe d'assistance! Nous vous répondrons dans les 24 heures. 

 

Auteur: Kara

Editeur: Yina

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter