Développeurs
Une installation npm. Exécution locale avec un moteur intégré : vos lignes extraites ne quittent jamais la machine.
Le moteur de données web que votre équipe peut exécuter depuis un ordinateur, un pipeline CI ou dans l'agent IA que vous lancerez bientôt - même binaire, même contrat.

Même CLI. Même codes de sortie. Même contrat JSON, qu'il s'exécute sur un ordinateur, en CI ou dans une boucle d'agent.
Une installation npm. Exécution locale avec un moteur intégré : vos lignes extraites ne quittent jamais la machine.
Ajoutez-le à GitHub Actions, Docker, Airflow ou cron. Codes de sortie stables, authentification par variables d'environnement sans écriture disque : validation sécurité dès le premier passage.
Donnez la CLI à Claude, Cursor ou à votre propre boucle d'agent. Le streaming JSONL permet à l'agent de planifier l'étape suivante avant la fin de l'exécution.
Le même binaire sur votre ordinateur, votre pipeline CI ou dans un agent : assez prévisible pour entrer en rotation d'astreinte.
Un analyste growth extrait chaque matin les prix concurrents dans un notebook Jupyter. Une exécution + un export de données : une feuille fraîche avant le café, sans Selenium à surveiller.
$ octoparse run lp-pricing
✓ 248 rows → pricing.csv
Une équipe data retail lance des extractions planifiées en CI chaque lundi à 06:00 UTC. Les codes de sortie stables routent les succès vers l'aval et les échecs vers l'astreinte : zéro conteneur à maintenir.
# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build
Une startup vertical-AI expose la CLI dans Claude / Cursor comme outil structuré. Le streaming JSONL donne un feedback ligne par ligne pour que l'agent planifie la suite avant la fin de l'exécution.
tool: octoparse.run
stream: jsonl
next_action: enrich rows
Six raisons pour lesquelles nos clients choisissent Octoparse et restent.
Plus de 200 templates prêts à exécuter : Amazon, LinkedIn, Google Maps, YouTube, Yelp, HN, Reddit, et plus encore. Une forme REST, les mêmes champs canoniques, sans maintenance XPath ni sélecteurs.
Pool de navigateurs, rotation de proxies, anti-bot, pagination, export structuré : éprouvé depuis 2018.
Vos exécutions, vos octets. Nous ne revendons pas, ne redistribuons pas et n'entraînons pas de modèles sur les données extraites pour vous. Définissez une durée de conservation, supprimez, c'est fait. Chaque exécution reçoit un trace_id pour audit ou replay.
JSON, JSONL, CSV, XLSX, XML : même forme canonique. Diffusez directement dans Snowflake via Airbyte, dbt, Airflow ou votre propre ETL.
Fonctionne nativement avec Claude, GPT, Cursor, Cline, Dify, LangChain. Le streaming JSONL permet à votre agent de planifier l'étape suivante avant la fin de l'exécution.
Essai gratuit, sans carte bancaire. Tarification transparente à l'usage ensuite. Des équipes remplacent leurs stacks de scraping internes pour 1/18 du coût RH.
Construit sur huit ans d'infrastructure de scraping et sur les retours d'équipes qui l'exécutent déjà en production.
"Nous sommes passés d'une flotte Selenium sur trois EC2 à une invocation CLI dans GitHub Actions."
"Notre boucle d'agent l'appelle comme outil. Le streaming JSONL lui permet de planifier la suite avant la fin. Un vrai changement pour l'UX."
"Codes de sortie stables, auth par variables d'environnement : validation sécurité dès le premier passage. C'est rare avec les outils de scraping."
Au service des équipes data et IA chez
Retirez le scraper. Gardez les données
Essai gratuit. Sans carte bancaire. La plupart des équipes l'exécutent en CI avant le standup quotidien.