Utilisateur:SyB~Anicium/Tutoriel DjVu/1

Objectif de l’étape : retirer du PDF tout ce qui peut l’être sans nuire au texte, afin de l’alléger.


Attention : dans certains cas, il est judicieux de garder les pages blanches qui faisaient partie de la numérotation d’origine : cela facilitera grandement la numérotation automatique sur la page d’index du livre ! Soyez donc prudent dans vos choix de découpe. Dans le doute, vous pouvez même sauter cette étape.

Passé cet avertissement, sachez que l’on peut sans crainte retirer les pages qui nuiraient à la pagination sur Wikisource, puisqu’elles ont été ajoutées au document original : par exemple, les pages de garde ajoutées par l’institution qui a numérisé l’ouvrage[1], éventuellement quelques pages blanches non numérotées, etc.

C’est dans cette étape que l’on se fait une première idée de l’organisation de l’ouvrage, et que l’on peut s’apercevoir qu’il manque des pages (fréquent !) ou que quelques pages ont été scannées plusieurs fois (encore plus fréquent !).


Préparation : cette étape est réalisable avec de très nombreux outils[2], mais allons au plus simple : le navigateur Chrome. Et comme dit plus haut, vous pouvez aussi attendre l’étape 3, une fois que vous aurez découpé le PDF en images plus faciles à manipuler.


Réalisation avec Chrome :

  1. Cliquez droit sur le fichier [ORIGINE]Titre du livre.pdf → Ouvrir avec… → Sélectionnez Chrome.
  2. Le PDF s’ouvre dans le navigateur web (pratique !).
  3. Cliquez sur le bouton d’impression en haut à droite. Dans la fenêtre qui s’ouvre, modifiez impérativement la destination, en cliquant sur le bouton « Modifier ». Là, vous allez voir la liste de vos périphériques d’impression, et vous sélectionnerez « Enregistrer au format PDF » dans les emplacements de destination locaux.
  4. C’est là que l’option de découpe apparaît : en face de « Pages », cochez la case en-dessous de « Tous », qui permet de sélectionner une ou plusieurs pages de texte. Dans le cas présent, nous allons inscrire « 3-26 », ce qui omet les pages 1 et 2, qui sont des ajouts de Gallica. Mais vous pouvez aussi noter quelque chose comme « 4-21, 23-24, 26 » pour omettre les pages 1 à 3, 22 et 25, tout en conservant la dernière page (26). Chrome donne automatiquement un aperçu du fichier qui va être enregistré : vous pouvez vérifier que tout est OK.
  5. Cliquez sur le bouton Enregistrer et donnez à ce nouveau fichier un nom différent du fichier d’origine, et suffisamment clair, par exemple « [Découpé]Titre du Livre.pdf »


Résultat d’étape : vous avez un tout petit peu allégé le fichier PDF, en ôtant des pages qui seraient apparues comme « ne devant pas être corrigées » sur Wikisource. S’il y avait beaucoup de pages superflues, vous avez en plus gagné du temps lors des prochaines étapes !


  1. D’une part, il s’agit (il me semble) d’une recommandation de Wikimedia Commons ; d’autre part, l’origine des images numérisées sera indiquée de façon claire dans le bandeau de licence sur Wikimedia Commons.
  2. Vous pouvez utiliser un logiciel dédié tel que PDF SAM (Split and Merge) : cette suite logicielle propose de nombreux outils pour bricoler des PDF : découpe, assemblages, fusion, etc. Une partie des fonctionnalités sont gratuites, voire toutes dans les versions anciennes. Un tutoriel complet est à découvrir à cette adresse.