Books Online
Suivi du prix des livres chez "Books To Scrape"
Introduction
Ces instructions vous permettent de :
- récupérer le programme,
- d'installer l'environnement nécessaire à son exécution,
- de l'exécuter,
- d'en connaitre le résultat
Pré-requis
paquets : python 3.11, python3.11-venv, git
modules : python requests, BeautifulSoup, csv, os
Installation
Voici les étapes à suivre pour avoir un environnement d'exécution opérationnel :
créer l'environnement virtuel
python3.11 -m venv env
source env/bin/activate
cloner le dépôt, aller dans le bon dossier
git clone https://mcstn.fr/gitea/Yann/Projet2.git
cd Projet2/rendu
installer les modules
pip install -r requirements.txt
Exécution
exécuter la commande :
python3 main.py
Résultat
Les fichiers sont placés dans un répertoire "resultat"
Le programme récupère les catégories sur la page d'accueil de l'URL, puis, pour chaque catégorie :
- affiche la catégorie traitée, le nombre de catégories restantes, de livres présents, traités au total et restants
- crée un dossier du nom de la catégorie, y enregistre les images des livres nommées en fonction du titre
- crée un fichier csv au nom de la catégorie, avec :
- product_page_url
- universal_ product_code (upc)
- title
- price_including_tax
- price_excluding_tax
- number_available
- product_description
- category
- review_rating
- image_url
$ time python3.11 main.py
1000 à traiter répartis en 50 catégories.
[ ... ]
Traitement terminé.
real 20m17,783s
user 4m30,695s
sys 0m3,172s
Auteur
Yann yann@needsome.coffee
License
N/A