Wikisource:Gallica
« Gallica est la bibliothèque numérique de la Bibliothèque nationale de France. En libre accès, elle regroupe des livres numérisés, des cartulaires, des revues, des photos et une collection d'enluminures. »
Début 2021, Gallica proposait près de huit millions de documents, dont 1,2 million de livres et 4,8 millions de numéros de presse et de revues[1]. C’est l’une des ressources principales pour l’édition sur Wikisource.
Droit d’auteur
modifierUne grande partie des livres numérisés par la BnF est dans le domaine public. L’information sur le droit d’auteur est donnée dans la notice de chaque livre, en cliquant sur son titre.
Il faut cependant toujours vérifier soi-même que le droit d’auteur autorise la réutilisation d’un livre dans Wikisource. Certains livres proposés par Gallica peuvent ne pas être dans le domaine public pour diverses raisons (partenariat, mention « domaine public » erronée).
Pour les revues des années 1920 et 1930, il faut être particulièrement attentif à ce point. Bon nombre de textes publiés dans ces revues ne peuvent être repris et publiés sur Wikisource.
Rechercher des textes
modifierUne page « Recherche avancée » (lien) permet de faire des recherches précises sur, entre autres, le nom d’un auteur ou le titre d’une œuvre.
Les résultats des recherches affichent des livres qui ne sont pas en consultation libre. Pour exclure ces livres, il faut utiliser les options Provenance et Type d’accès situées en bas à gauche.
À noter que la recherche dans les revues permet souvent de trouver des textes rares.
Téléchargement des fac-similés
modifierQualité des fac-similés
modifierLa qualité de numérisation est variable. Certaines images sont trop petites et/ou parasitées, ce qui rend les résultats d’une OCR de médiocre qualité. Il peut être utile de chercher le même livre sur d’autres sites et de faire une comparaison.
Les facs-similés de Gallica ont bien souvent de grandes marges qui ne sont pas très pratiques dans l’espace « Page ».
Gallica propose également de belles numérisations en couleurs de manuscrits et de livres anciens ou plus récents (Molière, Rimbaud, par exemple).
Téléchargement direct d'une page
modifierLes téléchargements se font dans la plupart des cas en cliquant sur « Téléchargement / impression ».
Ces téléchargements ne se font toutefois pas dans la plus haute qualité disponible. Pour disposer d'images en haute définition, il est possible d’utiliser IIIF[2].
Il suffit pour cela de visiter la page https://gallica.bnf.fr/iiif/ark:/12148/btv1b8449691v/f11/full/full/0/native
en remplaçant ark:/12148/btv1b8449691v
par l’identifiant ARK[3] de la page à laquelle vous vous intéressez (que vous trouverez dans l'URL de la page lorsque vous la visualisez[4]) et 11
(dans f11
) par le numéro d’ordre de la page dans le document (en commençant à 1, indépendamment de la pagination du document).
Il arrive que la récupération de certaines images en haute définition échoue, sans que le navigateur affiche un message d’erreur permettant d’en connaître la raison. Il est possible que cela fonctionne plus tard, ou bien que le scan soit trop ancien (voir la date de mise en ligne du document dans la section « En savoir plus »).
Utilisation d’un plug-in dans le navigateur
modifierLe plug-in iiif permet de récupérer facilement une page de Gallica en haute définition dans Firefox ou Chrome.
Ce plug-in ajoute une icône dans le navigateur, à droite du champ URL. Lorsque vous visitez une page de Gallica, l'icône devient rouge : en cliquant dessus, vous pouvez récupérer une version en haute définition de la page, soit au format JPG, soit au format TIFF.
Téléchargement de toutes les pages d'un livre par script
modifierDans certains cas, par exemple les numérisations de manuscrits, les pdf obtenus par téléchargement direct sont souvent inutilisables. On peut télécharger les images une par une pour obtenir des fac-similés un peu meilleurs, bien que la qualité reste encore un peu juste pour une conversion au format djvu.
Qualité PDF
modifierLe script suivant automatise le téléchargement de toutes les images d’un livre, à une qualité proche de celle du PDF :
lastpage="dernière page à télécharger"
for i in $(seq 1 $lastpage); do
p="http://gallica.bnf.fr/ark:/12148/identifiant du livre/f$i.highres"
wget -U DummyBrowser/0.1 $p -O page_`printf %04d $i`.jpg;
done
Haute qualité
modifierIl est également possible de télécharger une partie ou la totalité des pages scannées d’un livre dans la plus haute résolution disponible :
- soit en ocaml, voir /gallica.ml ;
- soit en Python 3, voir /gallica.py.
Utilisation du FTP
modifierPour utiliser FTP, il existe deux manières :
- votre navigateur internet,
- un logiciel spécialisé.
Préalablement, notez les références données par Gallica lorsque le fichier demandé a été généré (bas de la page). Vous aurez quelque chose comme chemin du fichier = ftp://ftp.bnf.fr/002/N0022607_PDF_1_484.pdf. Ici, le fichier que nous recherchons est N0022607_PDF_1_484.pdf présent dans le répertoire 002.
L’utilisation du navigateur implique que celui-ci soit assez récent. Vous pouvez alors taper l’adresse ftp.bnf.fr (ou ftp://ftp.bnf.fr) qui vous affichera alors la page « répertoire » de Gallica. Cette page répertoire donne une liste de sous-répertoires notés « nnn ». Dans notre cas, le sous-répertoire est 002. En cliquant sur ce répertoire, vous verrez apparaître une liste des fichiers, dont le vôtre. Utilisez « rechercher dans la page » (avec, dans notre cas, 22607) pour retrouver plus facilement votre fichier. Vous pouvez alors le télécharger en cliquant avec le bouton droit de la souris, puis « Enregistrer le lien sous… ».
Il existe également des logiciels de transfert FTP spécialisés, autorisant des transferts avec reprise en cas d’interruption. Parmi les gratuits, il y a notamment :
Le transfert de fichier avec reprise s’effectue en créant une file (queue) avec les fichiers demandés, puis en lançant la demande de chargement. Votre configuration locale, et notamment le pare-feu, ou la configuration de votre fournisseur d’accès internet peuvent gêner voire empêcher le fonctionnement de ces logiciels, et des opérations de paramétrage complexes du système d’exploitation, du pare-feu et/ou de ces logiciels peuvent être nécessaires.
Commande de fac-similé à la BnF
modifierIl est possible de payer pour avoir des numérisations de fac-similé à la BnF par le biais du site Achats reproduction BnF en fonction du Catalogue BnF.
Si la reproduction ne s'est pas faite à partir du document original, mais à partir soit d'un microfilm soit d'une microfiche. La politique des départements de collection de la BnF et de Gallica est de ne pas archiver dans Gallica des reproductions à partir de microfilms ou de microfiches (sauf cas particuliers bien identifiés). Les départements de collection peuvent décider de l'archivage ou non dans Gallica des documents de leurs collections que le service numérisation produit.
Il est également possible de scanner soi-même des documents dans les salles de lecture de la BnF (sites Richelieu et François-Mitterrand), en utilisant son propre smartphone. Des tentes de numérisation sont mises à disposition des lecteurs.
Modèles et catégories
modifierSur Wikisource
modifier- Voir Modèle:Gallica
Le modèle {{Gallica|}} permet de créer un lien vers une œuvre sur Gallica en utilisant son numéro de référence Gallica.
Sur Commons
modifierPartenariat entre Gallica et Wikisource
modifierLa BnF a fourni des fac-similés à Wikisource et a ajouté dans Gallica des liens vers Wikisource.
Archives de cette page
modifier- Anciennes discussions de 2005 sur le droit d’auteur.
Voir aussi
modifier- ↑ Site Gallica et Gallica en chiffres.
- ↑ Voir une documentation de l'API IIIF sur Gallica.
- ↑ Voir une description de l’identifiant ARK sur le site de la BNF.
- ↑ On peut aussi essayer d'ajouter une terminaison
.png
ou.jpg
à cette URL.