Toutes les collections
Octoparse 101
Leçon 0 : Découvrir Octoparse
Leçon 0 : Découvrir Octoparse
Mis à jour il y a plus d’une semaine

Bienvenue sur Octoparse ! Nous proposons des services principalement de web scraping. Avec notre logiciel, vous pouvez scraper des images, des produits, des urls, des chiffres, des textes etc.

Pour une meilleure expérience, je vous conseille de télécharger Octoparse sur votre ordinateur et de demander un essai gratuit pour le pack premium pour découvrir les fonctions les plus puissantes.



1. L'interface

Dès que vous vous connectez à Octoparse, vous trouverez deux sections principales : l'écran d'accueil et la barre latérale.

1.1 L'écran d'accueil

Une barre de recherche se trouve au centre de l'écran d'accueil.

Vous pouvez entrer un ou plusieurs URLs de la page Web cible pour créer une tâche.

Vous pouvez également entrer un nom de modèle gratuit (tel que [FR] Store Informations_Google Maps) pour obtenir des données que vous shoutaités scraper.


1.2 Le menu de la barre latérale

Dans le menu de la barre latérale à gauche, vous pouvez trouver tout ce dont vous avez besoin pour naviguer dans Octoparse.

  • +Nouveau bouton : créer / importer une nouvelle tâche ou créer de nouveaux groupes de tâches.

  • Tableau de bord : visualiser toutes vos tâches de scraping ici. Modifiez, supprimez, renommez et organisez toutes les tâches de votre compte. Vous pouvez facilement lancer, arrêter ou programmer des tâches.

  • Filtres Rapides & Tâches Récentes : Utilisez ces raccourcis pour accéder rapidement à vos tâches.

  • Modèles de web scraping : c'est par ici que vous pouvez trouver tous les modèles disponibles.

  • Nous contacter : Cliquez ici pour rechercher un tutoriel ou lancer une discussion rapide avec nous si vous avez des questions !

1.3 L'espace de Travail

L'espace de travail est l'endroit où vous créez votre tâche. Il se compose de 5 parties principales, chaque partie a son rôle.

  • Le navigateur intégré : Une fois que vous avez entré une URL cible, la page Web sera chargée dans le navigateur intégré d'Octoparse. Vous pouvez parcourir le site Web en Mode de navigation à droite en haut dans la fenêtre de navigateur intégré ou commencer à extraire les données dont vous avez besoin en Mode de Sélection.

  • Panneau de Conseils : Octoparse utilise ce panneau pour vous donner des conseils tout au long du processus de création de tâche.

  • Flux de travail : A mesure que vous interagissez avec la page Web, comme en ouvrant une page Web et en cliquant sur un élément/bouton, l'ensemble du processus est défini automatiquement sous la forme d'un flux de travail.

  • Paramètres : Vous pouvez voir les options de paramètres pour chaque action une fois que vous sélectionnez une certaine action.

  • Aperçu des Données : Vous avez un aperçu de données ici. Vous pouvez renommer les champs de données ou supprimer ceux qui ne sont pas nécessaires.

2. Fonctionnalités Principales

2.1 Modèles de Web Scraping

Les modèles sont des tâches pré-construites qui permettent aux utilisateurs d'obtenir des données en entrant des paramètres simples tels que des URL ou des mots-clés. Jusque maintenant, plus de 400 modèles de web scraping sont accessbiles sur Octoparse, couvrant la plupart des sites populaires et principles. Aucune configuration n'est nécessaire. Il vous suffit de

  1. trouvez le modèle par une recherche

  2. checker l'exemple de données pour voir ce que vous pouvez obtenir

  3. saisir les mots-clés ou URL

  4. cliquer pour lancer la tâche

  5. obenir des données souhaitées

Contrairement aux modèles prêts-à-l'emploi, le mode de personnalisation de tâches est beaucoup plus flexible et puissant qui vous permet de créer une tâche personnalisée selon vos besoin spécifiques. C'est assez robuste pour gérer les sites Web complexes, comme des pages avec JavaScript, AJAX ou tout autre site Web dynamique.

N'inquiétez pas ! Ce n'est pas difficile ni compliqué de créer votre propre tâche par vous-même. Equipé du tout nouvel algorithme de détection automatique, Octoparse détecte automatiquement les éléments sur une page et génère un flux de travail et d'autres paramètres de tâche, par exemple, pour extraire les données de la page de résultats et puis aller à la page de détail de chaque résultat.

Après que la détection automatique est terminée, vous pouvez modifier manuellement les paramètres de la tâche. Ou vous pouvez directement créer une tâche à partir de zéro en ignorant l'étape de détection automatique.

Une fois que vous êtes satisfait des données détectées automatiquement, vous cliquez simplement sur "Créer un flux de travail" et Octoparse générera automatiquement le workflow de la tâche. Vous pouvez ajouter des étapes supplémentaires au flux de travail ou modifier les actions manuellement si nécessaire.

2.3 Extraction Cloud

Octoparse propose une puissante plate-forme Cloud pour les utilisateurs premium (Standard et supérieur) pour exécuter les tâches 24/7. Quand vous exécutez une tâche sur Cloud, elle s'exécute dans le Cloud avec plusieurs serveurs en utilisant nos IP. Vous pouvez arrêter l'application ou votre ordinateur pendant l'exécution de la tâche. Plus de besoin de se soucier des limitations des matériels.

Les données extraites seront enregistrées dans le Cloud et accessibles à tout moment. Des fonctionnalités avancées telles que la rotation IP automatique, la programmation des tâches, le mode boost et l'API Octoparse font toutes partie du service Octoparse Cloud.

Ayant une première découverte de Octoparse, êtes-vous prêt à créer votre première tâche d'extraction de données ?


Avez-vous trouvé la réponse à votre question ?