« Wikisource:Gallica/gallica.py » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Code : Encore plus simple : possibilité de passer l'URL complète
Ligne 39 :
import urllib.request
import json
import re
import sys
 
Ligne 53 ⟶ 54 :
description="""
Récupère un ouvrage de Gallica en haute résolution.
Trois arguments doivent être passés : le numéro ARK, la(ou l'URL complète
du document sur Gallica), la page de début et la page de fin. Exemple pour le document
Exemple :
https://gallica.bnf.fr/ark:/12148/bpt6k1073366t/ :
python gallica.py bpt6k1073366t 1 649
python gallica.py https://gallica.bnf.fr/ark:/12148/bpt6k1073366t/ :1 649
 
Si toutes les pages ont une taille et des marges comparables,
Ligne 63 ⟶ 65 :
""")
# Arguments obligatoires
parser.add_argument('ark', help="numéroURL ARKcomplète dud'un documentouvrage sur Gallica, ou bien identifiant ARK")
parser.add_argument('debut', type=int, help="numéro de la première page à récupérer")
parser.add_argument('fin', type=int, help="numéro de la dernièer page à récupérer")
Ligne 84 ⟶ 86 :
args.ark, args.debut, args.fin, args.x, args.y, args.largeur, args.hauteur,
)
m = re.match(r'https://gallica.bnf.fr/ark:/[^/]+/(?P<ark>[\w\d]+).*', ark)
if m:
ark = m.group("ark")
print("ARK détecté : {}".format(ark))
if largeur is None or hauteur is None:
taille = get_size(ark, i)