undefined

Scraper toutes les images d'un carrousel d'images

Monday, July 05, 2021 10:39 AM

De nombreuses pages Web de produits utilisent un carrousel d'images (comme l'image ci-dessous) pour afficher plusieurs images sous forme de diaporama, que vous pouvez aussi faire défiler manuellement. Dans ce tutoriel, nous vous montrerons comment extraire l'image du carrousel dans le format que vous souhaitez.

 

mceclip0.png

 

1. Scaper une image dans une colonnemceclip2.png

2. Scraper plusieurs images dans différentes lignesmceclip0.png

3. Scraper toutes les images dans une seule colonne

mceclip10.png

 

 

1. Scaper une image dans une colonne

Le grattage de plusieurs images sur différentes colonnes est aussi simple que le grattage d'une seule image. nous utiliserons cette URL d'exemple pour vous démonstrer: https://www.ebay.com/itm/Lenovo-Legion-Y540-15-6-144Hz-i7-9750H-16GB-RAM-256GB-SSD-GTX-1660-Ti-Office/303553933195

Sélectionnez simplement l'une des images et sélectionnez "Extraire l'URL de l'image sélectionnée" dans le panneau Tips. Répétez les mêmes étapes pour récupérer toutes les autres URL d'image.

scrape_one_to_one.gif

 

 

 

2. Scraper plusieurs images dans différentes lignes

C'est aussi possible de scraper des images dans de différentes lignes de la même colonne en utilisant une action d'extraction en boucle.

1) Sélectionnez la première image

2) Continuez à sélectionner la deuxième image et choisissez "Extraire les URL des images".

loop_image.gif

 

 

3. Scraper toutes les images dans une seule colonne

Il y a deux manières pour scraper toutes les images dans une seule colonne.

Option 1. Combiner les URL des images extraites

Après avoir extrait en boucle les URL des images dans différentes lignes (en suivant les étapes de "Gratter les images dans différentes lignes"), vous pouvez ensuite combiner les données extraites pour fusionner les lignes différentes en une seule ligne.

1) Cliquez sur l'icône de paramètre pour l'action "Extraire les données".

2) Cliquez sur l'icône "voir plus" du champ de données, puis sélectionnez "Combiner les données", et "Combiner les données capturées".

2020-07-28_11-20-42.png

Option 2. Scraper le code HTML du carrousel et faites correspondre les URL des images à partir du code

1) Sélectionnez le carrousel tout entièrement et choisissez l'action "Extraire le code HTML externe de l'élément sélectionné" 

Scrape_HTML.gif

2) Accédez aux paramètres de l'action "Extraire les données", cliquez sur l'icône "Voir plus" pour le champ et sélectionnez "Nettoyer les données".

mceclip4.png

3)  Vérifiez le code pour trouver la valeur de départ et la valeur de fin de l'URL de l'image.

mceclip5.png

4) Cliquez sur "Ajouter une étape" et choisissez "Correspondre à une expression régulière"

mceclip6.png

5) Cliquez sur "Essayer l'outil RegEx"

mceclip7.png

6) Entrez la valeur de départ et de la fin pour générer un RegEx et appliquer le paramètre.

ReEx.png

 7) Cochez "Tout faire correspondre" et validez

mceclip8.png

 

 

 

Tips!

1. Les URL d'images récupérées sont des URL de miniatures. Si vous avez besoin d'obtenir les URL des images complètes, veuillez consulter ce tutoriel :

Comment récupérer les URL des images complètes au lieu des images miniatures?

 

Tutorial en español:  Scrapear todas las imágenes de un carrusel de imágenes

También puedes leer más tutoriales de web scraping en sitio web oficial

 

Auteur: Yina

Editeur: Isabel

 

Les articles récemment consultés

Nous utilisons des cookies pour améliorer votre expérience de navigation. Découvrez comment nous utilisons les cookies et comment vous pouvez les contrôler en cliquant sur les paramètres des cookies. Si vous continuez à utiliser ce site, vous consentez à notre utilisation des cookies.
Accepter Rejeter