Configurer les proxies IP
Thursday, July 14, 2022 4:58 PMSi vous avez rencontré l'un des problèmes ci-dessous, vous pourriez essayer de configurer les proxies IP manuellement dans Octoparse :
- Impossible de se connecter à Octotoparse parce que votre entreprise ou institution utilise un intranet et restreint les requêtes externes
- Le site web cible est très sensible au scraping et met en place des stratégies anti-scraping telles que le blocage d'IP pour bloquer les activités de scraping
Dans ce tutoriel, nous allons montrer comment configurer les proxies avec la dernière version pour résoudre les problèmes mentionnés ci-dessus.
Il y a 2 façons de le faire:
1. Utiliser un proxy pour se connecter à Octoparse (uniquement pour les problèmes de connexion).
2. Rotation des serveurs proxy externes pour contrecarrer le blocage d'IP.
1.Utiliser un proxy pour se connecter à Octoparse
- Cliquez sur
sur le panneau de connexion
- Entrez les informations proxy relatives à la procuration comme requis
- Vous pouvez tester pour voir si la connexion est bonne puis confirmer la configuration
2. Faire tourner les serveurs proxy externes pour contrecarrer le blocage d'IP
Les IP du Cloud Octoparse sont des IP de centre de données, qui peuvent être bloquées. Si un site web bloque votre IP ou le Cloud, vous pouvez configurer un proxy IP dans les paramètres de la tâche. Vous pouvez utiliser vos propres proxys IP ou utiliser les proxys intégrés d'Octoparse.
Configurer les proxies intégrés d'Octoparse
Les proxys Octoparse sont des IP résidentielles, ce qui leur permet de mieux éviter d'être bloqués.
- Ouvrez la tâche pour laquelle vous souhaitez configurer des proxies
- Cliquez sur
en haut à gauche
- Cochez Accéder aux sites Web via des proxies
- Cliquez sur Utiliser des proxies Octoparse
- Sélectionnez Default ou le Pays/Région que vous souhaitez pour l'adresse IP (Default signifie utiliser les IP des pays de Ramdon)
- Choisissez Rotate time pour l'intervalle de rotation
- Cliquez sur le bouton "save" dans le coin supérieur gauche de l'interface pour sauvegarder vos paramètres
Note : Les proxies Octoparse ne sont disponibles que sur la version 8.5.4. Vous pouvez télécharger la nouvelle version ici.
Assurez-vous que vous avez suffisamment de crédits Proxy ou de crédits de compte pour utiliser cette fonctionnalité. Pour activer les proxies IP, vous devez avoir au moins 3 $ en crédits de compte. Les crédits de compte affichés sur la page peuvent être utilisés pour l'achat de proxies. Vous pouvez simplement recharger vos crédits en cliquant sur le bouton "Add Credits button".
Utilisez vos propres proxies IP
Une autre façon de configurer les proxies IP est d'accéder à votre propre IP dans Octoparse. Vos propres proxies IP ne peuvent être appliqués que dans les exécutions locales.
- Cochez Utiliser mes propres Proxies
- Cliquez sur Configurer
- Saisissez IP Proxies dans la boîte
- Confirmez les paramètres
Notez qu'Octoparse ne prend en charge que les proxies HTTP - veuillez séparer l'adresse IP du serveur proxy et le numéro de port par deux points. Par exemple, 58.22.214.29:2318.