Comment utiliser Selenium pour contourner le reCAPTCHA ?

Selenium doit être combiné avec un service de résolution externe. Voici comment le processus s’articule en pratique : Extraire le sitekey reCAPTCHA depuis le code source de la page cible Envoyer le sitekey et l’URL à un service API (2Captcha, CapSolver, Anti-Captcha) Attendre le retour du token résolu (en moyenne 15 à 20 secondes) Injecter le token dans le champ g-recaptcha-response via JavaScript Soumettre le formulaire ou déclencher l’action protégée Extraire le sitekey reCAPTCHA depuis le code source de la page cible Envoyer le sitekey et l’URL à un service API (2Captcha, CapSolver, Anti-Captcha) Attendre le retour du token résolu (en moyenne 15 à 20 secondes) Injecter le token dans le champ g-recaptcha-response via JavaScript Soumettre le formulaire ou déclencher l’action protégée L’exemple de code Python dans la section Selenium/Puppeteer illustre cette logique. Pour les non-développeurs, Octoparse gère ce processus automatiquement.

Outils pour contourner les CAPTCHAs en 2026 : comparatif

Votre script tourne depuis une heure. Les données arrivent proprement. Puis, sans avertissement, plus rien : une page blanche, un code 403 ou un challenge CAPTCHA qui bloque tout le workflow. Si vous faites du web scraping, ce scénario vous est probablement familier.

En 2026, les CAPTCHAs ne ressemblent plus à ce qu’ils étaient. Cloudflare Turnstile analyse l’empreinte de votre navigateur avant même que vous ayez soumis une requête. reCAPTCHA v3 attribue un score de confiance à votre session de façon invisible. hCaptcha adapte son niveau de difficulté en temps réel selon votre comportement.

Les méthodes qui fonctionnaient il y a deux ans sont souvent mises en échec aujourd’hui. Et choisir le mauvais outil, c’est perdre du temps de développement, des données et parfois un projet entier.

Ce comparatif n’a pas vocation à être exhaustif. L’objectif est simple : vous aider à identifier l’outil qui correspond à votre profil technique, à votre budget et aux protections que vous rencontrez réellement sur le terrain.

Note légale (RGPD / CNIL) :

Le contournement de CAPTCHA pour collecter des données n’est pas neutre sur le plan juridique en France. La CNIL a publié des recommandations spécifiques sur le web scraping et la base légale de l’intérêt légitime. Ce point est traité dans la section FAQ en bas de page. Une analyse complète de la position de la CNIL et des bases légales applicables au scraping en France est disponible ici : lire l’analyse RGPD complète.

Pourquoi contourner les CAPTCHAs lors du web scraping ?

Ce que les CAPTCHAs coûtent vraiment à vos projets de collecte de données

Un CAPTCHA non géré n’est pas un simple inconvénient. C’est un point de rupture qui peut invalider des heures de développement et compromettre la fiabilité de toute une pipeline de données.

Perte de continuité : le scraper s’arrête sans message d’erreur explicite.
Blocage d’IP progressif : les CAPTCHAs répétés signalent votre adresse à des systèmes de réputation.
Faux négatifs invisibles : avec reCAPTCHA v3, votre requête passe mais la réponse est incomplète, sans indication d’erreur.
Délais non maîtrisés : attendre 30 secondes par CAPTCHA humain sur des milliers de pages rend tout projet à grande échelle impossible.

Dans les projets de veille tarifaire ou de génération de leads B2B, un blocage CAPTCHA non détecté peut fausser l’ensemble d’un fichier de prospection ou d’une analyse concurrentielle. Sur des pipelines à plusieurs milliers de requêtes par jour, le coût d’un solver mal configuré dépasse rapidement celui d’une solution professionnelle.

Les types de CAPTCHAs que vous allez rencontrer en 2026

Les 6 types de CAPTCHAs rencontrés en web scraping en 2026 : reCAPTCHA v2/v3, hCaptcha, Cloudflare Turnstile, AWS WAF et GeeTest — visibilité, difficulté et solvers recommandés

Tous les CAPTCHAs ne se traitent pas de la même façon. Avant de choisir un outil, il faut savoir à quoi vous avez affaire :

reCAPTCHA v2 : la case à cocher classique, encore très présente sur des sites anciens.
reCAPTCHA v3 : entièrement invisible, évalue le comportement et génère un score.
hCaptcha : alternative à reCAPTCHA, de plus en plus déployée. Analyse l’empreinte navigateur en temps réel.
Cloudflare Turnstile : majoritairement invisible, via fingerprinting JavaScript, canvas et TLS. Incompatible avec les solvers classiques OCR.
AWS WAF CAPTCHA : présent sur les sites à fort trafic (e-commerce, fintech).
GeeTest v4 : puzzle interactif, de plus en plus visible en Europe.

Sur le marché français en particulier, des plateformes comme Fnac, Cdiscount ou Leboncoin s’appuient massivement sur Cloudflare pour protéger leurs pages produits. C’est la protection que vous rencontrerez le plus souvent sur les sites e-commerce français à fort trafic.

Pour comprendre en détail le fonctionnement de chaque type, cet article sur les mécanismes des CAPTCHAs couvre les bases.

Contourner les CAPTCHAs en France : cadre légal et position de la CNIL

La CNIL considère qu’un CAPTCHA constitue une mesure technique de protection. Son contournement peut, dans certains cas, entrer en conflit avec les CGU d’un site ou avec la base légale du traitement de données. Pour des données non personnelles (prix publics, informations entreprises B2B), l’analyse reste nuancée. Pour des données personnelles, la vigilance s’impose. Ce point est repris dans la section FAQ en bas de page.

10 outils pour contourner les CAPTCHAs

Ce comparatif couvre 8 solutions représentatives du marché en 2026. Plutôt que d’allonger la liste, nous avons choisi de couvrir trois profils distincts avec les outils qui tiennent réellement la route en production : no-code, développeur API et infrastructure enterprise.

Comment choisir votre outil : trois profils, trois logiques

Comparatif des outils pour contourner les CAPTCHAs en 2026 selon le profil utilisateur : no-code, développeur API et infrastructure enterprise

Avant de parcourir les fiches, posez-vous deux questions :

Votre profil technique : êtes-vous à l’aise avec une API et du Python/Node.js, ou avez-vous besoin d’une interface visuelle sans code ?
Votre volume et votre type de CAPTCHA : quelques centaines de pages par jour ou des millions de requêtes ? Cloudflare Turnstile, reCAPTCHA v3 ou CAPTCHAs image classiques ?

Outil	Type	Cloudflare	Prix /1k	Ideal pour
Octoparse	No-code	Oui	Inclus	Équipes sans ressources tech
CapSolver	API IA	Oui	~0,80$	Développeurs, sites Cloudflare
Anti-Captcha	API mature	Partiel	~1,00$	Stack existante à conserver
2Captcha	Humain + API	Oui	~0,60$	Projets à faible coût/unité
CapMonster Cloud	API IA	Oui	~0,70$	Environnements de prod stables
Bright Data	Proxy + API	Oui	Sur devis	Grands comptes, infrastructure
Scrapfly	API full-stack	Oui	~1,50$	Dev full-stack, tout-en-un
Selenium/Puppeteer	Open source	Config.	Gratuit	Développeurs, contrôle total

1 — Octoparse

Profil : solution no-code tout-en-un, sans configuration anti-CAPTCHA manuelle

Octoparse est un outil de web scraping visuel qui intègre nativement la gestion des CAPTCHAs, la rotation de proxies IP et la détection automatique des éléments de page. Il n’y a rien à configurer côté anti-CAPTCHA : la logique est embarquée dans le moteur. C’est le choix naturel pour les équipes qui veulent collecter des données sans maintenir une infrastructure technique. Les workflows sont construits en quelques clics via une interface visuelle sans code, et les données exportées directement vers Excel, CSV, Google Sheets ou une base de données.

Rotation automatique des adresses IP pour éviter les blocages et les déclenchements de CAPTCHA
Gestion intégrée de hCaptcha et reCAPTCHA v2 dans les workflows cloud
Simulation du comportement humain (délais, mouvements) pour réduire les scores de détection
Exécution cloud avec planification automatique, sans machine locale
Compatible avec les sites JavaScript dynamiques et les pages à chargement différé

Octoparse : scrapez les sites protégés sans gérer un seul solver

Télécharger

Extraire les données vers Excel, CSV, Google Sheets ou base de données, même sur les sites protégés par CAPTCHA.

Détection automatique des éléments de page, sans configuration anti-CAPTCHA manuelle.

Scraper les sites populaires en quelques clics grâce aux modèles pré-construits.

Rotation de proxies IP intégrée pour ne jamais être bloqué lors du scraping.

Service Cloud pour programmer et automatiser la collecte de données à grande échelle.

Si votre cible principale est Amazon, les protections anti-bot de la plateforme suivent une logique spécifique que nous détaillons dans un guide dédié au scraping Amazon sans blocage.

2 — CapSolver

Profil : API IA, le plus rapide sur reCAPTCHA et Cloudflare Turnstile

CapSolver est le solver le plus cité dans les benchmarks 2026. Il repose exclusivement sur des modèles d’intelligence artificielle, ce qui lui permet d’atteindre des temps de résolution de 3 à 5 secondes sur reCAPTCHA v2 avec un taux de précision supérieur à 99 %. Sa principale force est la couverture des CAPTCHAs les plus récents : Cloudflare Turnstile (modes managed et non-interactive), reCAPTCHA v2/v3/Enterprise, hCaptcha, AWS WAF CAPTCHA, GeeTest v4, FunCaptcha.

Support natif de Cloudflare Turnstile, y compris le mode invisible
API compatible avec Python, Node.js, Go, Java, PHP – SDK disponibles
Extension Chrome pour les cas d’usage manuels ou semi-automatiques
Intégration proxy externe pour les sessions à haute confidentialité
Tableau de bord en temps réel avec statistiques de résolution par type de CAPTCHA

Tarifs et positionnement

Prix de départ : environ 0,80 $ pour 1 000 résolutions de reCAPTCHA v2. Modèle pay-as-you-go sans abonnement minimum. CapSolver convient en priorité aux développeurs qui gèrent des volumes importants ou qui scrapent des sites avec protection Cloudflare active.

À noter pour les entreprises françaises : CapSolver traite les données de résolution sur des serveurs basés aux États-Unis. Si votre projet implique des données personnelles, vérifiez la compatibilité avec votre politique de traitement des données avant intégration. Sur Trustpilot, CapSolver affiche une note de 4,7/5 sur la base de plusieurs centaines d’avis, avec des retours positifs sur la vitesse de résolution et la stabilité de l’API.

3 — Anti-Captcha

Profil : API mature, meilleure compatibilité d’intégration

Anti-Captcha est l’un des services les plus anciens du marché. Il combine résolution humaine et automatisation via OCR pour traiter un large spectre de types de CAPTCHAs. Sa maturité se traduit par une API très bien documentée et une compatibilité étendue avec les outils de scraping existants : Selenium, Playwright, Puppeteer, Scrapy. C’est le choix pragmatique pour les équipes qui ont déjà une infrastructure de scraping en place et veulent ajouter un solver sans refactoriser leur code.

Support de reCAPTCHA v2/v3, hCaptcha, FunCaptcha, image CAPTCHA et CAPTCHA texte
API HTTP simple avec retour de token – compatible avec toute stack technique
Extensions navigateur pour Chrome et Firefox
Support partiel de Cloudflare Turnstile – à vérifier selon la configuration cible
Tarification dynamique : vous ne payez que les CAPTCHAs résolus avec succès

Tarifs et positionnement

Environ 1,00 $ pour 1 000 reCAPTCHA v2. Anti-Captcha est le service le mieux adapté aux équipes qui ont déjà un pipeline de scraping fonctionnel et qui veulent ajouter un solver sans tout reconstruire. La migration depuis un service concurrent prend généralement moins d’une heure grâce à la compatibilité API. Sur Trustpilot, Anti-Captcha obtient une note de 4,5/5, avec des avis qui soulignent la fiabilité de l’API et la réactivité du support technique.

4 — 2Captcha

Profil : résolution humaine, l’option la plus économique pour les gros volumes

2Captcha fonctionne depuis 2007. Son modèle repose sur un réseau mondial d’opérateurs humains qui résolvent les CAPTCHAs en temps réel. Ce n’est pas le plus rapide (13 à 20 secondes en moyenne), mais c’est le plus large en termes de couverture : plus de 30 types de CAPTCHAs supportés.

Support de plus de 30 types de CAPTCHAs, dont des formats rares et spécifiques
API compatible avec les intégrations qui supportent déjà Anti-Captcha ou similaire
Remboursement automatique des CAPTCHAs résolus incorrectement

Tarifs et positionnement

À partir de 0,59 $ pour 1 000 résolutions standards. La résolution de reCAPTCHA v2 est facturée environ 2,00 $ pour 1 000 requêtes, avec une tarification dynamique qui monte aux heures de forte demande. 2Captcha est particulièrement adapté aux projets où la diversité des types de CAPTCHAs compte davantage que la vitesse de résolution. Sur Trustpilot, 2Captcha affiche une note de 4,6/5, avec des mentions récurrentes sur le large éventail de types de CAPTCHAs couverts et le prix compétitif.

5 — CapMonster Cloud

Profil : meilleur équilibre vitesse/prix/stabilité pour les environnements de production

CapMonster Cloud se distingue dans les benchmarks 2026 par sa régularité. Là où certains solvers excellent sur un type de CAPTCHA mais décrochent sur d’autres, CapMonster maintient des performances homogènes sur reCAPTCHA v2/v3, hCaptcha et Cloudflare Turnstile.

Support complet de reCAPTCHA v2/v3/Enterprise, hCaptcha, Cloudflare Turnstile, FunCaptcha
Compatibilité API avec 2Captcha – migration simplifiée
Dashboard avec monitoring des performances en temps réel
Intégration directe avec Selenium, Playwright et Puppeteer via les librairies officielles
Tarification stable sans pic de prix pendant les heures de pointe

Tarifs et positionnement

Environ 0,60 $ pour 1 000 reCAPTCHA v2, avec facturation uniquement sur les résolutions réussies : les tentatives échouées ne sont pas débitées. C’est un avantage concret pour les équipes en production qui veulent maîtriser leur budget sans surprise en fin de mois. Sur Trustpilot, CapMonster Cloud obtient une note de 4,4/5, avec des retours positifs sur la stabilité des performances et la transparence de la facturation.

6 — Bright Data

Profil : infrastructure proxy enterprise avec contournement anti-bot intégré

Bright Data n’est pas un solver de CAPTCHA au sens strict. C’est une infrastructure complète qui combine un réseau de proxies résidentiels, datacenter, ISP et mobiles avec deux produits complémentaires pour le contournement des protections anti-bot. Web Unlocker est le produit de Bright Data dédié au contournement des protections avancées. Il gère automatiquement les CAPTCHAs, le fingerprinting navigateur et les défis JavaScript, y compris Cloudflare Turnstile.

Réseau de plus de 72 millions d’IPs résidentielles dans 195 pays
Rotation d’IP automatique avec ciblage géographique précis
CAPTCHA Solver API : compatible avec les principaux types de CAPTCHAs en 2026
Conformité RGPD revendiquée – à vérifier selon votre cas d’usage spécifique

Tarifs et positionnement

Fonctionne sur devis pour les volumes enterprise. Proxies résidentiels à partir d’environ 15 $ pour 1 Go. C’est le choix des équipes data engineering qui scrapent à grande échelle sur des sites fortement protégés.

Pour les entreprises françaises ou européennes, Bright Data propose des options de routage via des serveurs basés dans l’UE. Vérifiez ce point avec leur équipe commerciale si la localisation des données est un critère contractuel pour votre organisation. Sur Trustpilot, Bright Data affiche une note de 4,5/5, avec des avis d’équipes data engineering qui soulignent la fiabilité du réseau de proxies et la qualité du support enterprise.

7 — Scrapfly

Profil : API full-stack, meilleur score anti-fingerprinting 2026

Scrapfly est une API de scraping qui gère en une seule intégration la rotation de proxies, le rendu JavaScript et le contournement des protections anti-bot. Dans le benchmark ScrapeOps de janvier 2026, il a obtenu le score le plus élevé (86,67/100) en matière de masquage des signatures d’automatisation. Scrapfly réduit la fréquence d’apparition des CAPTCHAs en faisant passer les requêtes pour du trafic humain légitime, avant même d’avoir à les résoudre.

Fondée à Paris en 2020, Scrapfly est l’une des rares API de scraping d’origine française. Pour les entreprises soumises à des contraintes de localisation des données ou souhaitant un interlocuteur de proximité, c’est un critère qui peut peser dans le choix.

Anti-bot bypass natif incluant Cloudflare, DataDome et Akamai
Rendu JavaScript avec exécution de scripts et interaction avec le DOM
Rotation de proxies intégrée sans configuration séparée
SDK Python et Node.js avec exemples de code pour les cas d’usage courants
Monitoring des requêtes et statistiques de succès par domaine cible

Tarifs et positionnement

Environ 1,50 $ pour 1 000 requêtes avec anti-bot activé. Scrapfly convient aux développeurs qui veulent une solution tout-en-un sans assembler plusieurs briques (proxy + solver + rendu JS). Sur Trustpilot, Scrapfly obtient une note de 4,8/5, ce qui en fait l’un des services les mieux notés de ce comparatif, avec des retours particulièrement positifs sur la documentation et la qualité du support.

8 — Selenium et Puppeteer

Profil : solutions open source pour développeurs qui veulent garder le contrôle

Selenium et Puppeteer sont des frameworks d’automatisation de navigateur, pas des solvers de CAPTCHA. Mais utilisés correctement, ils permettent de réduire considérablement les déclenchements de CAPTCHA en simulant un comportement humain authentique. Seuls, ils ne suffisent pas face à Cloudflare Turnstile ou reCAPTCHA v3 avancé. Mais combinés à un solver API (2Captcha, CapSolver ou Anti-Captcha), ils constituent une solution robuste et entièrement personnalisable.

Rotation des User-Agents et des en-têtes HTTP pour masquer les signatures d’automatisation
Ajout de délais aléatoires entre les actions pour imiter la navigation humaine
Utilisation de profils de navigateur persistants avec cookies de session
Intégration de proxies résidentiels pour varier l’adresse IP source
Désactivation des flags WebDriver détectables (navigator.webdriver)

Exemple d’integration : 2Captcha API + Selenium (Python)

Voici un exemple concret pour résoudre un reCAPTCHA v2 via l’API 2Captcha dans un workflow Selenium. Les développeurs non concernés par le code peuvent passer directement à la section suivante.

import requests, time
from selenium import webdriver
from selenium.webdriver.common.by import By

API_KEY  = 'VOTRE_CLE_2CAPTCHA'
SITE_KEY = 'SITEKEY_DU_SITE_CIBLE'
URL      = 'https://exemple.com/page'

def solve_recaptcha(api_key, site_key, url):
    # Soumettre le challenge a 2Captcha
    resp = requests.post('https://2captcha.com/in.php', data={
        'key': api_key, 'method': 'userrecaptcha',
        'googlekey': site_key, 'pageurl': url, 'json': 1
    })
    captcha_id = resp.json()['request']

    # Attendre la resolution (en moyenne 15-20 s)
    for _ in range(20):
        time.sleep(5)
        res = requests.get(
            f'https://2captcha.com/res.php?key={api_key}&action=get&id={captcha_id}&json=1'
        )
        if res.json().get('status') == 1:
            return res.json()['request']
    return None

# Injection du token dans le formulaire
driver = webdriver.Chrome()
driver.get(URL)
token = solve_recaptcha(API_KEY, SITE_KEY, URL)
if token:
    driver.execute_script(
        f'document.getElementById("g-recaptcha-response").innerHTML = "{token}";'
    )
    # Adaptez le sélecteur selon le formulaire cible
    driver.find_element(By.CSS_SELECTOR, '[type="submit"]').click()

Pour les équipes sans développeur, Octoparse intègre cette logique de façon transparente. Si vous débutez avec Python pour le scraping, ce tutoriel web scraping Python couvre les bases jusqu’à l’intégration d’une API de résolution de CAPTCHA.

Quel outil choisir pour contourner les CAPTCHAs en 2026 ?

Le contournement des CAPTCHAs en 2026 est un problème résolu, à condition de choisir l’outil adapté à votre contexte. Trois questions permettent de trancher rapidement.

Première question : avez-vous des ressources techniques en interne ? Si non, Octoparse est le point de départ logique : la gestion anti-CAPTCHA est intégrée sans configuration, et les workflows se construisent sans code. Si oui, passez à la question suivante.

Deuxième question : quel type de CAPTCHA rencontrez-vous principalement ? Pour Cloudflare Turnstile et reCAPTCHA v3, CapSolver et CapMonster Cloud offrent le meilleur rapport vitesse/précision en production. Pour une couverture large sur plus de 30 types de CAPTCHAs avec un coût minimal, 2Captcha reste la référence. Si vous avez déjà une infrastructure Selenium ou Playwright en place, Anti-Captcha s’intègre sans refactorisation.

Troisième question : quel est votre volume et votre niveau de contrainte d’infrastructure ? Pour des millions de requêtes par jour sur des sites fortement protégés, Bright Data propose un écosystème complet avec réseau de proxies résidentiels intégré. Pour une solution tout-en-un sans assembler plusieurs briques, Scrapfly gère proxy, rendu JS et anti-bot dans une seule intégration. Pour ceux qui veulent garder la main sur chaque étape du pipeline, Selenium ou Puppeteer combinés à un solver API restent la solution la plus personnalisable.

Dans tous les cas, la stratégie la plus efficace reste préventive : réduire le nombre de CAPTCHAs déclenchés avant de chercher à les résoudre. Proxies résidentiels, délais réalistes, rotation des user-agents : ce sont ces ajustements qui font souvent la différence entre un scraper bloqué et un pipeline qui tourne en continu.

FAQ — Contourner les CAPTCHAs

Comment désactiver la vérification CAPTCHA ?

Il n’est pas possible de désactiver directement un CAPTCHA côté utilisateur : c’est le site cible qui contrôle cette mesure. En revanche, plusieurs approches permettent de ne pas le déclencher ou de le contourner automatiquement.

Pour les non-développeurs, Octoparse intègre la gestion des CAPTCHAs nativement dans le workflow, sans configuration externe. Pour les développeurs, trois services API couvrent l’essentiel des cas rencontrés en production : 2Captcha résout les CAPTCHAs via opérateurs humains avec une couverture de plus de 30 types, Anti-Captcha propose une API bien documentée compatible avec Selenium, Playwright et Puppeteer, et CapSolver est l’option 100 % IA avec 3 à 5 secondes sur reCAPTCHA v2 et une prise en charge native de Cloudflare Turnstile en mode invisible.

Comment contourner un CAPTCHA invalide ?

Un CAPTCHA invalide survient le plus souvent dans trois cas : le token a expiré avant injection (délai de résolution trop long), la session a été interrompue entre la résolution et la soumission, ou le site cible a mis à jour son sitekey depuis la dernière requête.

Pour y remédier, commencez par réduire le délai entre la résolution du CAPTCHA et son injection dans le formulaire, en visant moins de 90 secondes. Si le problème persiste, actualisez la page et relancez la résolution sur une session fraîche après avoir vidé les cookies et le cache. Pour les workflows automatisés, un outil qui gère nativement les nouvelles tentatives et détecte l’expiration du token évite d’avoir à traiter ces cas manuellement.

Comment éviter les CAPTCHAs en améliorant l’empreinte de vos requêtes ?

La meilleure approche est préventive : agir sur l’empreinte de vos requêtes avant même que le CAPTCHA ne se déclenche. En pratique, cela passe par la rotation des user-agents et des en-têtes HTTP à chaque requête, l’ajout de délais aléatoires entre 2 et 8 secondes pour imiter une navigation humaine, et l’utilisation de proxies résidentiels plutôt que de datacenters, dont les plages d’IP sont beaucoup plus facilement détectées. Maintenir des cookies de session persistants contribue également à construire une réputation d’IP positive sur la durée.

Pour les équipes qui préfèrent déléguer cette gestion, des outils comme Octoparse appliquent ces optimisations en arrière-plan, sans configuration manuelle côté utilisateur.

Qu’est-ce que le CAPTCHA ?

CAPTCHA est l’acronyme de “Completely Automated Public Turing test to tell Computers and Humans Apart”. C’est un test de sécurité conçu pour distinguer les utilisateurs humains des robots. Les types courants en 2026 incluent reCAPTCHA v3 (invisible, score comportemental), Cloudflare Turnstile (fingerprinting navigateur) et hCaptcha (très déployé en Europe).

Comment utiliser Selenium pour contourner le reCAPTCHA ?

Selenium doit être combiné avec un service de résolution externe. Voici comment le processus s’articule en pratique :

Extraire le sitekey reCAPTCHA depuis le code source de la page cible
Envoyer le sitekey et l’URL à un service API (2Captcha, CapSolver, Anti-Captcha)
Attendre le retour du token résolu (en moyenne 15 à 20 secondes)
Injecter le token dans le champ g-recaptcha-response via JavaScript
Soumettre le formulaire ou déclencher l’action protégée

L’exemple de code Python dans la section Selenium/Puppeteer illustre cette logique. Pour les non-développeurs, Octoparse gère ce processus automatiquement.

Est-il légal de contourner des CAPTCHAs pour le web scraping en France ?

La réponse dépend du contexte. En France, la CNIL encadre le web scraping dans le cadre du RGPD. Pour des données non personnelles (prix publics, informations d’entreprises B2B), le cadre est plus souple, mais les CGU du site cible restent opposables. Pour des données personnelles, le contournement de mesures de protection techniques peut être qualifié d’accès non autorisé.

La recommandation officielle de la CNIL sur le web scraping est le point de départ pour comprendre le cadre légal applicable. Pour les implications pratiques côté entreprise, l’analyse RGPD dédiée au web scraping en France entre dans le détail des bases légales et des cas limites.

Contourner les CAPTCHAs en 2026 : comparatif de 8 outils selon votre profil technique

Pourquoi contourner les CAPTCHAs lors du web scraping ?

Ce que les CAPTCHAs coûtent vraiment à vos projets de collecte de données

Les types de CAPTCHAs que vous allez rencontrer en 2026

Contourner les CAPTCHAs en France : cadre légal et position de la CNIL

10 outils pour contourner les CAPTCHAs

Comment choisir votre outil : trois profils, trois logiques

1 — Octoparse

2 — CapSolver

3 — Anti-Captcha

4 — 2Captcha

5 — CapMonster Cloud

6 — Bright Data

7 — Scrapfly

8 — Selenium et Puppeteer

Quel outil choisir pour contourner les CAPTCHAs en 2026 ?

FAQ — Contourner les CAPTCHAs

Commencer votre découverte de Octoparse dès maintenant

Lecture conseillée