« Aide:Créer un fichier DjVu » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Conversion du fac-similé au format DjVu : Lien vers articles détaillés
Finalement je supprime les méthodes obsolètes
Ligne 55 :
 
Le logiciel gscan2pdf peut concaténer plusieurs fichiers image et enregistrer le résultat au format DjVu.
=== Ancienne méthode : Internet Archive ===
Cette méthode est '''obsolète''' : l’Internet Archive a cessé de convertir les fichiers au format DjVu. Elle est donc donnée à titre d’information, pour le cas où cette méthode serait réactivée.
 
{{Boîte déroulante/début|titre=Méthode avec Internet Archive}}
<s>À partir de Gallica et de Google Livres, la méthode la plus simple consiste à utiliser l'outil [http://tools.wmflabs.org/bub/index BUB], qui fait un chargement complet sur Internet Archive, vous notifie par messagerie, et vous propose ensuite de transférer le fichier sur Commons.</s> BUB ne fonctionne plus depuis plus d’une année.
 
Repérez le livre voulu sur Gallica ou Google Livres, notez l'adresse URL ou l'identifiant du livre :
 
;Exemple
:* Le livre [http://gallica.bnf.fr/ark:/12148/bpt6k57585164 Sonnets d'outre-tombe d'Eugène Villemin] sur Gallica a pour identifiant <tt>ark:/12148/bpt6k57585164</tt> (barre d'adresse)
:* Le livre [https://books.google.fr/books?id=UTBbAAAAQAAJ Annuaire de la province de la Flandre-orientale] sur Google Livre a pour identifiant <tt>UTBbAAAAQAAJ</tt> (barre d'adresse)
 
Vérifiez que le livre n’est pas déjà présent sur Internet Archive, s'il l'est vous pouvez passer à l’étape suivante.
 
Sur la page de l'outil [http://tools.wmflabs.org/bub/index BUB], renseignez le site d'origine Gallica ou Google Livres, l'identifiant ou l'URL du livre et votre adresse de courrier électronique. BUB récupère ensuite les informations principales décrivant le livre, sa langue et vérifie qu'il est dans le domaine public. Après confirmation, BUB procède à l'import du livre sur Internet Archive. Cette étape peut prendre plusieurs heures, BUB vérifie d'abord que le livre n'est pas déjà présent sur Internet Archive, constitue un fichier pdf, le charge sur Internet Archive. Enfin, le site Internet Archive établi un [[Aide:OCR|OCR]], et le converti en différents formats dont le format DjVu.
 
;Si le livre ne provient pas d’internet, procédure d’import détaillée :
 
Lorsque vous avez des images ou des fichiers à convertir, il n’est pas nécessaire de posséder un logiciel de conversion. Vous pouvez utiliser [http://archive.org/details/texts Convertir en DjVu avec Internet Archive] :
 
* Aide pour obtenir un DjVu en indiquant à l’OCR que le texte est en français. (nouvelle procédure depuis été 2013) :
 
:# <u>Créer un compte</u>[http://archive.org/account/login.createaccount.php] et/ou [http://www.archive.org/account/login.php Se connecter].
:# Adresse : [http://archive.org/upload/ http://archive.org/upload/]
:# Sélectionner sur votre ordinateur le fichier à importer (comme sur Commons) - Attention, il est important de choisir un nom court, sans blancs, sans caractères accentués, et ne risquant pas de déjà exister…
:# renseigner ensuite ''soigneusement'' la description (en indiquant le site et le lien d’où vient le fichier s’il a été récupéré en ligne)
:# mettre un ou deux "tags" en anglais sur la thématique du livre
:# indiquer l’auteur sous la forme nom, prénom, date de naissance-date de mort (dans la mesure du possible)
:# sélectionner la collection "Community texts" si ça n’est pas déjà fait
:# sélectionner la langue "French" et la licence "Public domain" (très important pour l’OCR)
:# ''add additional metadata'' taper "date" et mettre en valeur l’année d’édition, plus éventuellement "publisher" et le nom de l’éditeur
:# cliquer sur "Upload"
:c’est fait… il ne reste plus qu’à attendre que tous les fichiers soient dérivés pour pouvoir éditer les métadonnées (et mettre un titre "lisible") et récupérer le fichier djvu…
::pour suivre l’avancement du fichier : [http://www.us.archive.org/catalog.php?whereami=1 liste des fichiers en cours de traitement] votre email est surligné en jaune
:: le fichier apparaît également dans la liste [http://www.us.archive.org/catalog.php?whereami=1] avec votre email surligné en jaune…
:: [http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF] : il suffit de remplacer l’identifiant par celui de votre fichier pour savoir où vous en êtes…
::*il ne reste plus qu’à attendre que la dérivation se termine (''cela peut prendre plusieurs heures, selon la taille du fichier'')
::*quand le fichier disparaît de la liste, vous pouvez retourner sur la page principale du fichier
* <u>Récupération du fichier djvu</u> :
:* Pour récupérer le fichier DjVu : cliquer sur '''''SHOW ALL''''', ensuite télécharger le fichier qui se termine par <tt>.djvu</tt>, ou utiliser le torrent et un logiciel de téléchargement de torrent (si vous savez comment faire).
:* pour le nommer, respecter les [[Aide:Espace « Livre »|conventions de nommage]]<br />
 
 
:*'''Avantage de ce système''' : si vous avez un PDF sans OCR, Internet Archive fera l’OCR pour vous (généralement de bonne qualité), à condition de bien préciser la langue.
:*'''Inconvénient''' : s’il y en avait un, vous perdez l’OCR d’origine…
{{Boîte déroulante/fin}}
 
== Transfert du livre sur [[commons:|Wikimedia Commons]] ==
Ligne 120 ⟶ 73 :
 
Après quelques secondes, le DjVu est disponible sur Commons et sur Wikisource. Vous pouvez commencer à éditer le livre. Voir pour cela la page d'aide sur l'[[Aide:Espace « Livre »|espace « Livre »]].
 
=== Ancienne méthode : Internet Archive ===
{{Boîte déroulante/début|titre=Ancienne méthode avec Internet Archive}}
Lorsque la conversion est achevée, vous recevrez un courriel sur votre boîte vous indiquant la réussite du transfert sur Internet Archive et vous proposant de transférer le livre sur Commons. Cette deuxième étape est également en grande partie automatisée. Elle utilise l'outil [https://tools.wmflabs.org/ia-upload/commons/init iaUploadBot]. Vous devez autoriser iaUploadBot à utiliser votre compte pour faire le transfert (OAuth).
 
Vous devez saisir sur iaUploadBot, l'identifiant du livre sur Internet Archive :
;Exemple
:* Le livre [https://archive.org/details/bub_gal_ark_12148_bpt6k2049581 Contes danois / Andersen] sur Internet Archive a pour identifiant <tt>bub_gal_ark_12148_bpt6k2049581</tt> (barre d'adresse)
 
Voir plus haut pour le nommage du fichier.
 
Après cette étape, ia-upload collecte les données concernant le livre, vérifiez et complétez ces données afin de fournir la description la plus complète du fichier. Il utilise le modèle {{m|Book}}. Vérifiez également la licence fournie qui doit être compatible avec les règles de Commons.
{{Boîte déroulante/fin}}
 
== Pour aller plus loin ==