logo
Télécharger
languageFRdown
menu
Octoparse CLI

Octoparse,depuis votre terminal.

Le moteur de données web que votre équipe peut exécuter depuis un ordinateur, un pipeline CI ou dans l'agent IA que vous lancerez bientôt - même binaire, même contrat.

Lire la documentation
  • Essai gratuit · sans carte bancaire
  • Multiplateforme
  • Contrat stable

Trois équipes. Un binaire

Même CLI. Même codes de sortie. Même contrat JSON, qu'il s'exécute sur un ordinateur, en CI ou dans une boucle d'agent.

Développeurs

Une installation npm. Exécution locale avec un moteur intégré : vos lignes extraites ne quittent jamais la machine.

Équipes DevOps

Ajoutez-le à GitHub Actions, Docker, Airflow ou cron. Codes de sortie stables, authentification par variables d'environnement sans écriture disque : validation sécurité dès le premier passage.

Agents IA

Donnez la CLI à Claude, Cursor ou à votre propre boucle d'agent. Le streaming JSONL permet à l'agent de planifier l'étape suivante avant la fin de l'exécution.

Une commande. Trois scénarios de déploiement

Le même binaire sur votre ordinateur, votre pipeline CI ou dans un agent : assez prévisible pour entrer en rotation d'astreinte.

« Il me faut ce CSV avant le standup. »

Un analyste growth extrait chaque matin les prix concurrents dans un notebook Jupyter. Une exécution + un export de données : une feuille fraîche avant le café, sans Selenium à surveiller.

$ octoparse run lp-pricing
✓ 248 rows → pricing.csv
Temps de configuration~ 90 secondes
Durée quotidienne< 3 min

« Branchez-le à notre extraction hebdomadaire. »

Une équipe data retail lance des extractions planifiées en CI chaque lundi à 06:00 UTC. Les codes de sortie stables routent les succès vers l'aval et les échecs vers l'astreinte : zéro conteneur à maintenir.

# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build
Alertes d'astreinte7 → 0 / mois
Stack économiséeFlotte Selenium

« Donnez la CLI à mon agent comme outil. »

Une startup vertical-AI expose la CLI dans Claude / Cursor comme outil structuré. Le streaming JSONL donne un feedback ligne par ligne pour que l'agent planifie la suite avant la fin de l'exécution.

tool: octoparse.run
stream: jsonl
next_action: enrich rows
Robustessegarantie
Temps de configuration< 2 secondes

Le moteur de données web auquel les équipes reviennent

Six raisons pour lesquelles nos clients choisissent Octoparse et restent.

Couverture mondiale prête à l'emploi

Plus de 200 templates prêts à exécuter : Amazon, LinkedIn, Google Maps, YouTube, Yelp, HN, Reddit, et plus encore. Une forme REST, les mêmes champs canoniques, sans maintenance XPath ni sélecteurs.

8 ans d'infrastructure de scraping

Pool de navigateurs, rotation de proxies, anti-bot, pagination, export structuré : éprouvé depuis 2018.

Vos données. Vos règles.

Vos exécutions, vos octets. Nous ne revendons pas, ne redistribuons pas et n'entraînons pas de modèles sur les données extraites pour vous. Définissez une durée de conservation, supprimez, c'est fait. Chaque exécution reçoit un trace_id pour audit ou replay.

Sortie structurée, tous formats

JSON, JSONL, CSV, XLSX, XML : même forme canonique. Diffusez directement dans Snowflake via Airbyte, dbt, Airflow ou votre propre ETL.

Conçu pour l'IA dès le premier jour

Fonctionne nativement avec Claude, GPT, Cursor, Cline, Dify, LangChain. Le streaming JSONL permet à votre agent de planifier l'étape suivante avant la fin de l'exécution.

Meilleur rapport valeur/prix de la catégorie

Essai gratuit, sans carte bancaire. Tarification transparente à l'usage ensuite. Des équipes remplacent leurs stacks de scraping internes pour 1/18 du coût RH.

Assez silencieux pour ne jamais vous réveiller

Construit sur huit ans d'infrastructure de scraping et sur les retours d'équipes qui l'exécutent déjà en production.

3M+heures d'exécution cloud
99,97%disponibilité cloud · 90 j
31benchmarks OS
10 ansinfrastructure de scraping

"Nous sommes passés d'une flotte Selenium sur trois EC2 à une invocation CLI dans GitHub Actions."

Ravi P. avatarRavi P.Staff DevOps · plateforme retail D2C

"Notre boucle d'agent l'appelle comme outil. Le streaming JSONL lui permet de planifier la suite avant la fin. Un vrai changement pour l'UX."

Elena N. avatarElena N.Founding engineer · startup vertical-AI

"Codes de sortie stables, auth par variables d'environnement : validation sécurité dès le premier passage. C'est rare avec les outils de scraping."

Thomas K. avatarThomas K.Architecte sécurité · Enterprise SaaS

Au service des équipes data et IA chez

Lumen LabsNorthwindQuanta AIDrift RetailHelio CapitalMosaic.ioPlurabankFieldNoteStride HealthArgon FoodsPivotsoftCobalt & Co.

Questions fréquentes

Retirez le scraper. Gardez les données

Essai gratuit. Sans carte bancaire. La plupart des équipes l'exécutent en CI avant le standup quotidien.