« Avec Octoparse, nous décidons quelles données nous voulons et sous quelle forme. Il me suffit de tout configurer, puis de laisser tourner sur le Cloud 24h/24… J’ai besoin d’énormément de données, des millions de lignes. Si je devais embaucher quelqu’un pour les collecter manuellement, cela me coûterait des millions de yens. »
— Nakamura, Fondateur d’Officecab

À propos d’Officecab
Nakamura dirige sa propre entreprise au Japon depuis 22 ans. Il vend principalement des cartes de jeu — notamment des cartes Pokémon — à l’international sur eBay. Être japonais lui a ouvert facilement l’accès à ce marché. Mais eBay est une place de marché très concurrentielle, et il a vite compris qu’il lui fallait une approche fondée sur les données pour devancer les autres vendeurs et augmenter ses ventes.
Le défi : obtenir l’historique des prix
Officecab a besoin de données pour la recherche de produits et l’analyse des prix. À ses débuts, quand les volumes restaient modestes, Nakamura a tenté d’embaucher des freelances pour collecter les données à la main. Mais les délais posaient un vrai problème, et le coût était extrêmement élevé.
À mesure que son activité s’élargit à de nouveaux produits, Nakamura a besoin de bien plus de données pour ses analyses — et d’une méthode plus intelligente, plus efficace et plus économique pour les collecter à grande échelle.
L’Aventure du Web Scraping
« Avant Octoparse, j’embauchais des freelances pour rassembler les données manuellement », se souvient Nakamura. « Le travail finissait par être fait, mais le processus était long et pénible. »
La communication tournait au casse-tête. « Par exemple, ils ne savaient pas que “フシギダネ” et “Bulbasaur” (le nom d’un Pokémon) désignaient la même chose. Pour me fournir les données dont j’ai besoin, ils doivent maîtriser l’anglais et le japonais, mais aussi très bien connaître l’univers Pokémon. Sinon, le moindre détail manqué peut réduire tous les efforts à néant », explique-t-il.
Octoparse est devenu son outil de référence pour l’acquisition automatique de données. « Avec Octoparse, nous décidons quelles données nous voulons et sous quelle forme. Je n’ai qu’à tout paramétrer, puis à laisser le programme tourner sur le Cloud 24h/24 et 7j/7, en toute autonomie. J’ai besoin d’une grande quantité de données, plus de six millions de lignes. Si je devais embaucher quelqu’un pour les collecter manuellement, cela coûterait des millions de yens », précise-t-il.
Octoparse lui permet aussi de constituer une base de données des ventes passées, qui auraient sinon disparu. « Je récupère en continu des données de vente sur eBay qui seront supprimées dans quelques mois », explique Nakamura. « Je n’en ai pas forcément besoin tout de suite, mais je suis certain qu’elles me seront très utiles pour mes analyses dans un avenir proche. »
Heureusement pour lui, le web scraping est moins répandu au Japon qu’il ne le pensait — ce qui lui donne une longueur d’avance sur ses concurrents locaux.
Pourquoi choisir Octoparse
Garder une longueur d’avance grâce au Big Data
« Certaines données sont nettoyées régulièrement, comme les historiques de ventes sur eBay : quelques mois plus tard, elles disparaissent. Je les collecte avec Octoparse même si je n’en ai pas l’usage immédiat. Grâce à cela, j’ai réuni des millions de lignes à analyser et j’en ai beaucoup appris sur le commerce des cartes à collectionner. »
« Les données fraîches que nous rassemblons aujourd’hui seront encore utiles des années plus tard. C’est exactement ce que nous voulons, et c’est impossible à faire manuellement. Sans Octoparse, nous n’aurions pas pu mener ce type de recherche ni constituer la base de données que nous possédons aujourd’hui. »
« Le web scraping est peu répandu au Japon, ce qui nous donne un avantage en matière d’accès à l’information. Les gens refusent simplement de payer pour des données qui n’ont pas d’utilité immédiate. »
Obtenir des données précises grâce à l’automatisation
« Les prestataires ne peuvent pas obtenir ce que je veux si les consignes passent mal. S’ils sélectionnent les mauvaises lignes de données, tous les efforts peuvent être réduits à néant. Avec Octoparse, je garde un contrôle total sur les données que je récupère. Il me suffit de tout configurer, puis de laisser tourner sur le Cloud 24h/24 et 7j/7, en toute autonomie. »
« Même si je pourrais écrire un script Python pour obtenir des données gratuitement, je suis convaincu qu’Octoparse est plus efficace. »
Économiser davantage grâce au web scraping
« À ce jour, j’ai rassemblé une énorme quantité de données — environ 6 millions de lignes provenant d’un ensemble de boutiques. C’est exactement ce que nous avons obtenu avec Octoparse. Autrement, le travail manuel aurait coûté bien plus cher. »



