« Aide:Créer un fichier DjVu » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Voir aussi : adresse sur wmflabs.
En cours de refonte -> méthode simplifiée
Ligne 36 :
* Documentation obscure ou inexistante.
 
== Trouver des fac-similés sur Internet : méthode simplifiée ==
== Conversion d’images en DjVu ==
 
Plusieurs sites offrent des fichiers d’images, aux formats pdf ou tif par exemple. C’est le cas de Gallica et de Google Livres.
À partir de fac-similés au format ''jpg'', ''pdf'', ''tif'', etc., obtenus sur Internet ou scannés, comment créer un fichier au format DjVu :
 
Voir les [[Aide:Ressources libres de droit|Ressources libres de droit]] : sites proposant des fac-similés.
=== À partir de votre ordinateur ===
 
À partir de Gallica et de Google Livres, la méthode la plus simple consiste à utiliser l'outil [http://tools.wmflabs.org/bub/index BUB], qui fait un chargement complet sur Internet Archive, vous notifie par messagerie, et vous propose ensuite de transférer le fichier sur Commons.
* [[Aide:Créer un fichier DjVu/Windows|Créer un fichier DjVu sous Windows]]
* [[Aide:Créer un fichier DjVu/Linux|Créer un fichier DjVu sous GNU/Linux]]
* [[Aide:Créer un fichier DjVu/MacOS|Créer un fichier DjVu sous MacOS]] : à partir du pdf, le plus simple est de passer par la "conversion en ligne" (voir section suivante)
 
=== Première étape : transfert du livre sur Internet Archive ===
=== Conversion en ligne ===
 
Repérez le livre voulu sur Gallica ou Google Livres, notez l'adresse URL ou l'identifiant du livre :
{{ambox
| text = Testé ! Pour les fichiers provenant de '''Google''' (y compris US), et aussi de '''Gallica''', vous pouvez maintenant utiliser l'outil [http://tools.wmflabs.org/bub/index BUB], qui fait un chargement complet sur IA, vous notifie par messagerie, et vous propose ensuite de transférer le fichier sur Commons.
| type = notice
}}
 
;Exemple
Lorsque vous avez des images ou des fichiers à convertir, il n’est pas nécessaire de posséder un logiciel de conversion. Vous pouvez utiliser [http://archive.org/details/texts Convertir en DjVu avec Internet Archive] :
:* Le livre [http://gallica.bnf.fr/ark:/12148/bpt6k57585164 Sonnets d'outre-tombe d'Eugène Villemin] sur Gallica a pour identifiant <tt>ark:/12148/bpt6k57585164</tt> (barre d'adresse)
:* Le livre [https://books.google.fr/books?id=UTBbAAAAQAAJ Annuaire de la province de la Flandre-orientale] sur Google Livre a pour identifiant <tt>UTBbAAAAQAAJ</tt> (barre d'adresse)
 
Vérifiez que le livre n’est pas déjà présent sur Internet Archive, s'il l'est vous pouvez passer à l’étape suivante.
* Aide pour obtenir un DjVu en indiquant à l’OCR que le texte est en français. (nouvelle procédure depuis été 2013) :
 
Sur la page de l'outil [http://tools.wmflabs.org/bub/index BUB], renseignez le site d'origine Gallica ou Google Livres, l'identifiant ou l'URL du livre et votre adresse de courrier électronique. BUB récupère ensuite les informations principales décrivant le livre, sa langue et vérifie qu'il est dans le domaine public. Après confirmation, BUB procède à l'import du livre sur Internet Archive. Cette étape peut prendre plusieurs heures, BUB vérifie d'abord que le livre n'est pas déjà présent sur Internet Archive, constitue un fichier pdf, le charge sur Internet Archive. Enfin, le site Internet Archive établi un [[Aide:OCR|OCR]], et le converti en différents formats dont le format DjVu.
:# <u>Créer un compte</u>[http://archive.org/account/login.createaccount.php] et/ou [http://www.archive.org/account/login.php Se connecter].
:# Adresse : [http://archive.org/upload/ http://archive.org/upload/]
:# Sélectionner sur votre ordinateur le fichier à importer (comme sur Commons) - Attention, il est important de choisir un nom court, sans blancs, sans caractères accentués, et ne risquant pas de déjà exister…
:# renseigner ensuite ''soigneusement'' la description (en indiquant le site et le lien d’où vient le fichier s’il a été récupéré en ligne)
:# mettre un ou deux "tags" en anglais sur la thématique du livre
:# indiquer l’auteur sous la forme nom, prénom, date de naissance-date de mort (dans la mesure du possible)
:# sélectionner la collection "Community texts" si ça n’est pas déjà fait
:# sélectionner la langue "French" et la licence "Public domain" (très important pour l’OCR)
:# ''add additional metadata'' taper "date" et mettre en valeur l’année d’édition, plus éventuellement "publisher" et le nom de l’éditeur
:# cliquer sur "Upload"
:c’est fait… il ne reste plus qu’à attendre que tous les fichiers soient dérivés pour pouvoir éditer les métadonnées (et mettre un titre "lisible") et récupérer le fichier djvu…
::pour suivre l’avancement du fichier : [http://www.us.archive.org/catalog.php?whereami=1 liste des fichiers en cours de traitement] votre email est surligné en jaune
:: le fichier apparaît également dans la liste [http://www.us.archive.org/catalog.php?whereami=1] avec votre email surligné en jaune…
:: [http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF] : il suffit de remplacer l’identifiant par celui de votre fichier pour savoir où vous en êtes…
::*il ne reste plus qu’à attendre que la dérivation se termine (''cela peut prendre plusieurs heures, selon la taille du fichier'')
::*quand le fichier disparaît de la liste, vous pouvez retourner sur la page principale du fichier
* <u>Récupération du fichier djvu</u> :
:* Pour récupérer le fichier DjVu : cliquer sur '''''All Files:HTTP''''', ensuite télécharger le fichier qui se termine par <tt>.djvu</tt>, ou utiliser le torrent et un logiciel de téléchargement de torrent (si vous savez comment faire).
:* pour le nommer, respecter les [[Aide:Espace « Livre »|conventions de nommage]]<br />
 
=== Deuxième étape : transfert du livre sur [[commons:|Wikimedia Commons]] ===
 
Lorsque la première étape est achevée, vous recevrez un courriel sur votre boîte vous indiquant la réussite du transfert sur Internet Archive et vous proposant de transférer le livre sur Commons. Cette deuxième étape est également en grande partie automatisée. Elle utilise l'outil [https://tools.wmflabs.org/ia-upload/commons/init iaUploadBot]. Vous devez autoriser iaUploadBot à utiliser votre compte pour faire le transfert.
:*'''Avantage de ce système''' : si vous avez un PDF sans OCR, Internet Archive fera l’OCR pour vous (généralement de bonne qualité), à condition de bien préciser la langue.
:*'''Inconvénient''' : s’il y en avait un, vous perdez l’OCR d’origine…
 
Vous devez saisir sur iaUploadBot, l'identifiant du livre sur Internet Archive :
;Exemple
:* Le livre [https://archive.org/details/bub_gal_ark_12148_bpt6k2049581 Contes danois / Andersen] sur Gallica a pour identifiant <tt>bub_gal_ark_12148_bpt6k2049581</tt> (barre d'adresse)
 
Vous devez également donner le nom du fichier sur Commons, cette étape est importante car le nom du fichier doit respecter les conventions de nommages des œuvres.
 
* [http://any2djvu.djvuzone.org/ Any2DjVu] : fournit un service en ligne de conversion au format DjVu. Il est possible de récupérer l’adresse ftp d’un fichier pdf de Gallica et de l’entrer directement dans Any2DjVu Server. Cependant, lorsque le fichier ''pdf'' a été obtenu sur Gallica, il est souvent préférable de commencer par retravailler les fac-similés, afin d’obtenir un meilleur cadrage dans l’espace ''page''. Voir plus haut pour la procédure à suivre.
 
== Trouver des fac-similés sur Internet ==
 
Plusieurs sites offrent des fichiers d’images, aux formats pdf ou tif par exemple. C’est le cas de Gallica et de Google Livres. Pensez à conserver les informations exactes relatives à l’édition (éditeur, date d’édition, etc.) et à donner la source du fichier.
 
;Voir
:*[[Aide:Ressources libres de droit|Ressources libres de droit]] : sites proposant des fac-similés.
:*[[Aide:Créer un fichier DjVu/À partir d’un pdf de Google Books|Créer un fichier DjVu à partir d’un pdf de Google Books]]
 
=== Cas des images au format JPEG 2000 ===
 
L’Internet Archive fournit les scans bruts et retaillés qui servent à créer les fichiers djvu et pdf qui sont aussi téléchargeables sur ce site. Pour diverses raisons, on peut vouloir utiliser ces images (refaire l’OCR, images mal découpées), mais elles sont souvent dans le format [[:w:JPEG 2000|JPEG 2000]] (extension .jp2) qui est difficile à manipuler<ref>Pour plus de choix, voir le recensement sur la Wikipedia anglophone [[:w:en:JPEG_2000#Application_support]].</ref>.
 
==== Leur manipulation sous GNU/Linux ====
Sous Linux, on peut utiliser ImageMagick, ou d'autres programmes.
 
===== Avec ImageMagick =====
ImageMagick est un logiciel, en ligne de commande, de manipulation d'images dans pratiquement tous les formats existants<ref>Voir, pour les commandes de base [http://doc.ubuntu-fr.org/imagemagick ubuntu-fr].</ref>.
 
Pour afficher l'image (ensuite, clic ou clic droit sur l'image pour accéder aux menus) :
{{Centré|<code>display image.jp2</code>}}
 
Pour convertir une image :
{{Centré|<code>convert image.jp2 image.jpg</code>}}
 
Pour convertir tout un dossier :
{{Centré|<code>mogrify -format jpg *.jp2</code>}}
 
===== Avec d'autres programmes =====
On peut aussi installer openjpeg-tools, qui permettra de convertir au format pnm toutes les images .jp2 d’un même dossier avec la commande j2k_to_image.
{{Centré|<code>j2k_to_image -ImgDir dossier-images-jp2/ -OutFor pnm</code>}}
 
Gimp peut lire les images jp2 avec le plug-in [http://registry.gimp.org/node/9899 JPEG 2000]<ref>Téléchargez-[http://registry.gimp.org/files/jp2.tar.gz le], décompressez-le et copiez-le dans ~/.gimp-2.8/plug-ins/</ref>. Le délai de conversion reste relativement long, cependant.
 
Enfin, pour une seule image et avec une interface graphique, on peut utiliser le visionneur d’images de Gnome (eog) et le définir par défaut pour ce type d’images. Ce visionneur est capable de convertir les images jp2 : faire « Image », puis « Enregistrer sous… », et choisir un format de sortie.
----
{{références}}
==== Leur manipulation sous Windows ====
Sous Windows, l’utilitaire gratuit (mais non libre) Xnview contient un plugin pour ce format, ce qui permet de faire des conversions directes vers de nombreux autres formats.
 
== Utilisation du format DjVu en mode ''page'' ==
 
: ''Voir [[Aide:Importer un fichier|Importer un fichier]]''
: ''Voir [[Aide:Espace « Page »|Espace « Page »]] et [[Aide:Espace « Livre »|Espace « Livre »]] pour l’utilisation d’un djvu dans Wikisource''
 
Une fois le fichier DjVu copié sur Commons ou Wikisource, il faut créer une page d’index, qui permet la navigation entre pages.
Pour accéder à la page d’index d’un fichier Djvu, il suffit de cliquer sur '''Lien vers l’index.''', depuis la page '''Fichier:Le titre du livre.djvu''', ou en anglais '''File:Le titre du livre.djvu'''.
 
=== Convention de nommage des fichiers djvu ===
 
:<small>'''Syntaxe des nommages, emploi des virgules et du tiret :''' voir <span class="plainlinks">[http://fr.wikisource.org/wiki/Aide:Conventions_de_nommages_des_%C5%93uvres#Conventions_de_nommage_d.E2.80.99une_.C5.93uvre_et_de_ses_divisions {{coloré|darkgreen|Guide typographique.|yellow}}]</span></small>
 
Il est recommandé de nommer ainsi les fichiers djvu :
{{Centré|« <code>Auteur - Titre.djvu »</code> ou « <code>Auteur - Titre, Tome.djvu »</code>}}
 
En cas d’éditions successives :
 
{{Centré|« ''<code>Auteur - Titre, date, tome.djvu'' »</code>}}
 
Pour les cas les plus compliqués, consultez la page [[Aide:Conventions de nommages des œuvres]].
Exemple :<nowiki> [[Fichier:Hugo - Les Misérables, 1890, tome I.djvu]]</nowiki>
 
== Trouver des fac-similés sur Internet : autres méthodes ==
En résumé, les indications se mettent dans l’ordre suivant :
La méthode simplifiée est uniquement valable pour un nombre restreint de sites ; pour les cas particuliers non traités par la méthode en ligne simplifiée, voir : [[/Méthodes complètes]]
 
{{Centré|ESPACE:AUTEUR - TITRE, ANNÉE, TOME.DJVU}}
 
== Ressources ==
 
Conversion en ligne
 
* [http://www.archive.org Internet Archive]
* [http://any2djvu.djvuzone.org/ Any2DjVu]
 
Utilitaires de conversion
* [http://www.trustfm.net/GeneralTools/SoftwarePdfToDjvuGUI.php pdf2djvu gui]
* DjVu Solo
* [http://djvu.sourceforge.net/ DjVu Libre]
 
Visualiseurs :
*[http://sourceforge.net/project/showfiles.php?group_id=114927 WinDjView]
*STDU Viewer
 
Liste de ressources sur dvju.org
*[http://djvu.org/resources/ djvu.org]
 
== Voir aussi ==
* [[Aide:Demander l’importation d’un livre|Demander l’importation d’un livre]]
* [[Aide:Comment numériser|Comment numériser]]
* [[Aide:Importer un fichier|Importer un fichier]]
 
* [[Aide:ImporterEspace un« fichierPage »|ImporterEspace « unPage fichier»]]
* [[Aide:Espace « Livre »|Espace « Livre »]]
* [https://tools.wmflabs.org/ia-upload/commons/init iaUploadBot] pour importer les DjVu de l’Internet Archive / [https://tools.wmflabs.org/bub/ Book Uploader Bot]
* [[Aide:EspaceInsérer «une Page »image|Espace «Insérer Pageune »image]]
*[[Aide:Espace « Livre »|Espace « Livre »]]
*[[Aide:Comment numériser|Comment numériser]]
*[[Aide:Demander l’importation d’un livre|Demander l’importation d’un livre]]
*[[Aide:Insérer une image|Insérer une image]]
 
[[Catégorie:Aide]]