Ouvrir le menu principal

Vous êtes ici : accueil >Aide >Publier un livre >Créer un fichier DjVu

Aide : Manuel de Wikisource

Sommaire

En brefModifier

PrésentationModifier

Voir l’article DjVu sur Wikipédia.

DjVu (prononcé « déjà-vu ») est un format de fichier libre destiné à l’archivage de documents numériques.

Intérêts :

  • tous les fac-similés d’un livre sont disponibles en un seul fichier ;
  • tous les fac-similés sont consultables à partir de la page du fichier DjVu ;
  • les fac-similés sont utilisables dans l’espace page ;
  • la taille du fichier DjVu est très petite ;

Défauts :

  • la numérotation des fac-similés n’est pas configurable.
  • Perte de qualité variable.
  • Conversion complexe à configurer.
  • Documentation obscure ou inexistante.

Pour plus d'arguments, voir DjVu vs. PDF sur le Wikisource anglophone.

Trouver des fac-similés sur InternetModifier

Plusieurs sites offrent des fichiers d’images, aux formats pdf ou tif par exemple. C’est le cas de Gallica et de Google Livres.

Voir les Ressources libres de droit : sites proposant des fac-similés.

Conversion au format DjVuModifier

Il convient ensuite de convertir le document pdf au format DjVu. Certains logiciels, comme pdf2djvu et les utilitaires regroupés dans DjVuLibre, permettent de réaliser cette conversion et de manipuler le fichier résultant (par exemple pour supprimer certaines pages inutiles).

Vous pouvez également faire une demande sur le Scriptorium.

Ancienne méthode : Internet ArchiveModifier

Cette méthode est obsolète : l’Internet Archive a cessé de convertir les fichiers au format DjVu en 1996. Elle est donc donnée à titre d’information.

À partir de Gallica et de Google Livres, la méthode la plus simple consiste à utiliser l'outil BUB, qui fait un chargement complet sur Internet Archive, vous notifie par messagerie, et vous propose ensuite de transférer le fichier sur Commons. BUB ne fonctionne plus depuis plus d’une année.

Repérez le livre voulu sur Gallica ou Google Livres, notez l'adresse URL ou l'identifiant du livre :

Exemple

Vérifiez que le livre n’est pas déjà présent sur Internet Archive, s'il l'est vous pouvez passer à l’étape suivante.

Sur la page de l'outil BUB, renseignez le site d'origine Gallica ou Google Livres, l'identifiant ou l'URL du livre et votre adresse de courrier électronique. BUB récupère ensuite les informations principales décrivant le livre, sa langue et vérifie qu'il est dans le domaine public. Après confirmation, BUB procède à l'import du livre sur Internet Archive. Cette étape peut prendre plusieurs heures, BUB vérifie d'abord que le livre n'est pas déjà présent sur Internet Archive, constitue un fichier pdf, le charge sur Internet Archive. Enfin, le site Internet Archive établi un OCR, et le converti en différents formats dont le format DjVu.

Si le livre ne provient pas d’internet, procédure d’import détaillée 

Lorsque vous avez des images ou des fichiers à convertir, il n’est pas nécessaire de posséder un logiciel de conversion. Vous pouvez utiliser Convertir en DjVu avec Internet Archive :

  • Aide pour obtenir un DjVu en indiquant à l’OCR que le texte est en français. (nouvelle procédure depuis été 2013) :
  1. Créer un compte[1] et/ou Se connecter.
  2. Adresse : http://archive.org/upload/
  3. Sélectionner sur votre ordinateur le fichier à importer (comme sur Commons) - Attention, il est important de choisir un nom court, sans blancs, sans caractères accentués, et ne risquant pas de déjà exister…
  4. renseigner ensuite soigneusement la description (en indiquant le site et le lien d’où vient le fichier s’il a été récupéré en ligne)
  5. mettre un ou deux "tags" en anglais sur la thématique du livre
  6. indiquer l’auteur sous la forme nom, prénom, date de naissance-date de mort (dans la mesure du possible)
  7. sélectionner la collection "Community texts" si ça n’est pas déjà fait
  8. sélectionner la langue "French" et la licence "Public domain" (très important pour l’OCR)
  9. add additional metadata taper "date" et mettre en valeur l’année d’édition, plus éventuellement "publisher" et le nom de l’éditeur
  10. cliquer sur "Upload"
c’est fait… il ne reste plus qu’à attendre que tous les fichiers soient dérivés pour pouvoir éditer les métadonnées (et mettre un titre "lisible") et récupérer le fichier djvu…
pour suivre l’avancement du fichier : liste des fichiers en cours de traitement votre email est surligné en jaune
le fichier apparaît également dans la liste [2] avec votre email surligné en jaune…
http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF : il suffit de remplacer l’identifiant par celui de votre fichier pour savoir où vous en êtes…
  • il ne reste plus qu’à attendre que la dérivation se termine (cela peut prendre plusieurs heures, selon la taille du fichier)
  • quand le fichier disparaît de la liste, vous pouvez retourner sur la page principale du fichier
  • Récupération du fichier djvu :
  • Pour récupérer le fichier DjVu : cliquer sur SHOW ALL, ensuite télécharger le fichier qui se termine par .djvu, ou utiliser le torrent et un logiciel de téléchargement de torrent (si vous savez comment faire).
  • pour le nommer, respecter les conventions de nommage


  • Avantage de ce système : si vous avez un PDF sans OCR, Internet Archive fera l’OCR pour vous (généralement de bonne qualité), à condition de bien préciser la langue.
  • Inconvénient : s’il y en avait un, vous perdez l’OCR d’origine…

Transfert du livre sur Wikimedia CommonsModifier

Le transfert du fichier sur Commons se fait au moyen des mêmes méthodes que les transferts d’images ou d’autres documents.

Le nom du fichier doit respecter les conventions de nommages des œuvres. Il est recommandé de nommer ainsi les fichiers djvu :

Auteur - Titre.djvu ou Auteur - Titre, Tome.djvu

En cas d’éditions successives :

Auteur - Titre, date, tome.djvu

Pour les cas les plus compliqués, consultez la page Aide:Conventions de nommages des œuvres.

Certains modèles (par exemple Template:Gallica pour un document pris sur Gallica) sont utilisables pour faciliter l’insertion des méta-données.

Après quelques secondes, le DjVu est disponible sur Commons et sur Wikisource. Vous pouvez commencer à éditer le livre. Voir pour cela la page d'aide sur l'espace « Livre ».

Ancienne méthode : Internet ArchiveModifier

Lorsque la conversion est achevée, vous recevrez un courriel sur votre boîte vous indiquant la réussite du transfert sur Internet Archive et vous proposant de transférer le livre sur Commons. Cette deuxième étape est également en grande partie automatisée. Elle utilise l'outil iaUploadBot. Vous devez autoriser iaUploadBot à utiliser votre compte pour faire le transfert (OAuth).

Vous devez saisir sur iaUploadBot, l'identifiant du livre sur Internet Archive :

Exemple
  • Le livre Contes danois / Andersen sur Internet Archive a pour identifiant bub_gal_ark_12148_bpt6k2049581 (barre d'adresse)

Voir plus haut pour le nommage du fichier.

Après cette étape, ia-upload collecte les données concernant le livre, vérifiez et complétez ces données afin de fournir la description la plus complète du fichier. Il utilise le modèle {{Book}}. Vérifiez également la licence fournie qui doit être compatible avec les règles de Commons.

Pour aller plus loinModifier

Pour plus d'informations sur le traitement des fichiers PDF et DjVu en fonction notamment du système d’exploitation, voir :

Voir aussiModifier