Projet2/rendu/README.md
2024-11-20 13:07:30 +01:00

86 lines
1.7 KiB
Markdown

# Books Online
Suivi du prix des livres chez "Books To Scrape"
## Introduction
Ces instructions vous permettent de :
- récupérer le programme,
- d'installer l'environnement nécessaire à son exécution,
- de l'exécuter,
- d'en connaitre le résultat
### Pré-requis
```
paquets : python 3.11, python3.11-venv, git
modules : python requests, BeautifulSoup, csv, os
```
### Installation
Voici les étapes à suivre pour avoir un environnement d'exécution opérationnel :
créez l'environnement virtuel
```
python3.11 -m venv env
source env/bin/activate
```
cloner le dépôt, aller dans le bon dossier
```
git clone https://mcstn.fr/gitea/Yann/Projet2.git
cd Projet2/rendu
```
installez les modules
```
pip install -r requirements.txt
```
## Exécution
```
python3 main.py
```
## Résultat
Les fichiers sont placés dans un répertoire "resultat"
Le programme récupère les catégories sur la page d'accueil de l'URL, puis, pour chaque catégorie :
1. affiche la catégorie traitée, le nombre de catégories restantes, de livres présents, traités au total et restants
2. crée un dossier du nom de la catégorie, y enregistre les images des livres nommées en fonction du titre
3. crée un fichier csv au nom de la catégorie, avec :
- product_page_url
- universal_ product_code (upc)
- title
- price_including_tax
- price_excluding_tax
- number_available
- product_description
- category
- review_rating
- image_url
```
$ time python3.11 main.py
1000 à traiter répartis en 50 catégories.
[ ... ]
Traitement terminé.
real 20m17,783s
user 4m30,695s
sys 0m3,172s
```
## Auteur
Yann <yann@needsome.coffee>
## License
N/A